Google DeepMind hat mit SIMA 2 einen neuen Maßstab für KI-Agenten gesetzt. Der Gemini-basierte Agent versteht Anweisungen, plant, lernt aus Fehlern und erreicht in unbekannten Spielen nahezu menschliche Leistung.
Im Vergleich zum Vorgänger verdoppelt sich die Erfolgsquote: SIMA 2 löst 45-75 % der Aufgaben in Spielen wie MineDojo oder ASKA – SIMA 1 schaffte nur 15-30 %.
Das Besondere: Der Agent benötigt keine menschlichen Trainingsdaten. Er verbessert sich durch Trial-and-Error – unterstützt von Gemini, das Aufgaben generiert, bewertet und aus Fehlern lernt.
SIMA 2 analysiert den Bildschirm in Echtzeit, simuliert Tastatur- und Maus-Eingaben und interagiert wie ein menschlicher Mitspieler. Er ist kein reiner Beobachter, sondern ein aktiver Gaming-Partner.
DeepMind testete den Agenten auch in künstlich generierten Welten von Genie 3. Selbst in völlig neuen Umgebungen passte sich SIMA 2 erfolgreich an.
Die Architektur basiert auf multimodaler Verarbeitung: Bild, Text und Aktion werden kombiniert. Gemini dient als „Gehirn“ für Planung und Reflexion.
Ein typisches Szenario: Der Nutzer sagt „Baue eine Brücke über den Fluss“. SIMA 2 analysiert die Umgebung, plant Schritte, sammelt Materialien und führt aus – oft kreativer als erwartet.
Fehler werden nicht bestraft, sondern analysiert. Gemini generiert eine Bewertung: „Die Brücke ist eingestürzt, weil das Fundament zu schwach war.“ Nächster Versuch: bessere Statik.
In ASKA, einem Survival-Spiel, lernte SIMA 2 innerhalb von Minuten, Werkzeuge herzustellen, zu jagen und eine Basis zu bauen – ohne vorherige Daten.
Die Leistung nähert sich menschlichem Niveau bei einfachen bis mittleren Aufgaben. Komplexe Strategien wie in Echtzeit-Strategiespielen sind noch Herausforderung.
DeepMind sieht Spiele als ideales Testfeld für agentische KI. Die Umgebungen sind kontrolliert, aber vielfältig – perfekt, um Generalisierung zu trainieren.
SIMA 2 ist kein Gaming-Produkt, sondern ein Forschungsdemonstrator. Doch die Technologie könnte bald in Robotik, Simulationen oder virtuellen Assistenten Einzug halten.
Die Fähigkeit, in unbekannten Welten zu lernen, ist entscheidend für reale Anwendungen. Ein Roboter in einer Fabrik muss sich ebenso anpassen können.
Kritiker bemängeln die Abhängigkeit von Gemini. Ohne das große Sprachmodell wäre die Planung eingeschränkt. Doch genau das macht die Stärke aus: Kombination von Vision und Sprache.
Zukunftsvision: SIMA 2 als Co-Pilot in Spielen, der Tipps gibt, Aufgaben übernimmt oder sogar als Gegner agiert – mit individueller Spielweise.
Die Gaming-Industrie beobachtet gespannt. Könnte KI bald professionelle Spieler herausfordern? In einfachen Spielen ist es bereits Realität.
DeepMind betont die Sicherheit: SIMA 2 hat keine Zugriff auf das Internet, keine persistenten Speicher – alles findet in sandboxed Umgebungen statt.
Dennoch: Die Fähigkeit, selbstständig zu lernen und zu handeln, birgt Risiken. Was, wenn solche Agenten in falsche Hände geraten?
Fazit: SIMA 2 ist der bisher überzeugendste Beweis, dass KI nicht nur reagieren, sondern aktiv in dynamischen Welten handeln kann. Der nächste Gaming-Partner könnte bald aus dem Rechenzentrum kommen.
Quelle: The Rundown
Weitere KI News aus KI-Entwicklung & Forschung:
- OpenAI bringt GPT-5.1 mit Persönlichkeits-Presets
- AI-Pionierin plädiert für räumliche Intelligenz
- GPT-5 knackt erstmals ein vollständiges 9x9-Sudoku