AI-Pionierin plädiert für räumliche Intelligenz

| Von Dennis Mark | AI & Technology Blog

Dr. Fei-Fei Li, oft als „Godmother of AI“ bezeichnet, hat kürzlich einen wegweisenden Essay veröffentlicht. Darin argumentiert sie, dass der nächste große Sprung in der Künstlichen Intelligenz nicht durch weitere Sprachmodelle, sondern durch räumliche Intelligenz kommen wird.

Räumliche Intelligenz bedeutet: Systeme, die dreidimensionale Welten verstehen, darüber nachdenken und diese sogar generieren können – und zwar physikalisch konsistent. Li sieht hierin die Brücke von reiner Sprache zu echter Wahrnehmung und Handlung.

Während Large Language Models (LLMs) wie GPT hervorragend darin sind, abstraktes Wissen zu verarbeiten und Texte zu generieren, versagen sie bei grundlegenden räumlichen Aufgaben. Ein einfaches Beispiel: Ein LLM kann nicht zuverlässig abschätzen, ob ein Objekt in einen Raum passt oder wie sich ein Ball bei einem Stoß bewegt.

Li betont, dass räumliches Verständnis der kognitive Kern menschlicher Intelligenz ist. Babys lernen die Welt nicht durch Sprache, sondern durch Sehen, Berühren und Bewegen. Genau diesen Weg müsse KI nun nachholen.

Der Schlüssel dazu sind sogenannte Weltmodelle (World Models). Diese müssen in der Lage sein, realistische 3D-Umgebungen zu erzeugen, Eingaben wie Bilder, Videos oder Aktionen zu interpretieren und vorherzusagen, wie sich die Welt verändert.

Ein solches Modell müsste etwa verstehen, dass ein Glas umfällt, wenn es zu nah am Tischrand steht – und zwar nicht nur als Textbeschreibung, sondern als physikalische Simulation. Das erfordert tiefes Verständnis von Schwerkraft, Masse, Reibung und Dynamik.

Li verweist darauf, dass aktuelle LLMs zwar Milliarden von Texten gelernt haben, aber kaum visuelle oder physikalische Daten in diesem Maße. Hier liegt die große Lücke – und gleichzeitig die Chance.

Ihr Startup World Labs arbeitet genau daran: KI-Systeme zu entwickeln, die die Welt nicht nur beschreiben, sondern aktiv modellieren und simulieren können. Auch Tech-Giganten wie Google und Tencent investieren massiv in dieses Feld.

Ein konkretes Beispiel: In der Robotik könnten solche Modelle einem Roboter ermöglichen, eine Küche zu navigieren, ohne dass jede Bewegung vorher programmiert wurde. Der Roboter würde die Physik der Welt verstehen und entsprechend handeln.

In der Wissenschaft könnten räumlich intelligente KI-Systeme molekulare Interaktionen in 3D vorhersagen – etwa wie ein Medikament an ein Protein bindet. Das würde die Arzneimittelforschung beschleunigen.

Im Klimabereich könnten solche Modelle komplexe Wettersysteme simulieren, Strömungen visualisieren und Vorhersagen treffen, die weit über aktuelle Modelle hinausgehen.

Auch im Design – etwa Architektur oder Produktdesign – könnte KI nicht nur Skizzen vorschlagen, sondern ganze Gebäude in ihrer physikalischen Realität testen: Stabilität, Belastung, Lichtverhältnisse.

Doch die Herausforderung ist enorm. KI muss nicht nur lernen, was sie sieht – sie muss lernen, wie die Welt funktioniert. Das erfordert riesige Datensätze aus der realen Welt: Videos, Sensorendaten, physikalische Messungen.

Li warnt: Ohne diesen Schritt bleibt KI auf Sprache und Abstraktion beschränkt. Sie wird nie wirklich „verstehen“, was sie sagt – und schon gar nicht, wie sie in der Welt handeln soll.

Die gute Nachricht: Der Fortschritt ist bereits im Gange. Neue Architekturen, die Vision und Physik kombinieren, entstehen. Und mit Li an der Spitze wächst die Bewegung.

Kritisch betrachtet birgt räumliche Intelligenz auch Risiken. Wer kontrolliert die Weltmodelle? Können sie missbraucht werden, um realistische Täuschungen zu erzeugen? Wie stellen wir sicher, dass die Physiksimulationen korrekt sind?

Zudem: Die Rechenleistung für 3D-Weltmodelle ist enorm. Nicht jedes Unternehmen wird mithalten können. Das könnte zu einer Konzentration von Macht bei wenigen Akteuren führen.

Trotzdem überwiegen die Chancen. Räumliche Intelligenz könnte KI endlich aus dem digitalen Raum in die physische Welt bringen – und damit völlig neue Anwendungen ermöglichen.

Fazit: Dr. Fei-Fei Li hat mit ihrem Essay einen wichtigen Impuls gesetzt. Der Fokus der KI-Forschung muss sich erweitern – von Sprache hin zu Raum, Physik und Handlung. Nur so entsteht eine wirklich intelligente KI.

Wer die Zukunft der KI verstehen will, sollte räumliche Intelligenz auf dem Schirm haben. Sie ist der nächste große Schritt – und er kommt schneller, als viele denken.

Quelle: The Rundown

Weitere KI News aus KI-Entwicklung & Forschung:
- GPT-5 knackt erstmals ein vollständiges 9x9-Sudoku
- OpenAI warnt: Vorbereitung auf superintelligente KI notwendig
- Kimi K2 Thinking: Open-Source-KI erreicht Frontier-Niveau

Artikel teilen

#RäumlicheIntelligenz #Weltmodelle #FeiFeiLi #3DReasoning #AIRobotik #WissenschaftlicheKI #SpatialAI
← Zurück zum Blog | Home