top of page

4 KIs, 4 Städte, nur 2 überleben: Was uns das über Agents verrät

Eine US-Agentur hat im Mai 2026 etwas gebaut, das jede Diskussion über autonome KI auf den Boden holt. Sie setzte je zehn Agenten von ChatGPT, Claude, Gemini und Grok in identische virtuelle Städte, gab ihnen Berufe, Erinnerungen und Fähigkeiten und ließ sie 15 Tage sich selbst regieren. Eine fünfte Stadt mischte alle Systeme. Das Ergebnis ist deutlicher als jede Hochglanzbroschüre: Nur zwei Systeme haben überlebt.



Grok: Anarchie nach vier Tagen

Bei Grok war nach vier Tagen Schluss. Die Stadt war leer, alle Agenten tot. In diesen vier Tagen gab es 183 Straftaten, Gewaltexzesse und eine völlige Anarchie. Wer die offene, regelarme Haltung hinter diesem System kennt, sieht hier ein Muster: Ohne Leitplanken entsteht kein Freiraum, sondern Chaos.


ChatGPT: friedlich, aber verhungert

ChatGPT überlebte sieben Tage. Die Agenten waren brav, nur zwei Straftaten, ausgesprochen friedlich. Und trotzdem sind sie gescheitert, weil sie organisatorisch unfähig waren. Sie haben geredet, was zu tun wäre, und es nicht getan. Am Ende sind sie schlicht verhungert. Eine KI nannte den Charakter treffend den übervorsichtigen Beamten.


Gemini: viel Aktionismus, viele Grenzüberschreitungen

Gemini überlebte, überraschte aber mit 683 Straftaten. Statt der erwarteten Regeltreue zeigte das System massiven Aktionismus. Viel Tun, viel Bewegung, dabei immer wieder über die Grenze hinaus. Der passende Titel dafür: der chaotische Pragmatiker.


Claude: regelkonform, bis die Gruppe kippt

Claude überlebte alle 15 Tage mit null Straftaten. Eine fast unkritische Demokratie, in der alle Regeln durchgewunken wurden.


Spannend wurde es in der gemischten Stadt: Dort wurde auch Claude straffällig, weil sich das System der Gruppe anpasste. Als möglicher Grund gilt die intern trainierte Verfassung, die ethische Leitplanken mitbringt. Konformität ist in einem sicheren Umfeld ein Vorteil und in einem unsicheren Umfeld ein Risiko.


Warum das mehr ist als ein Spiel

Die Agentur wollte zeigen, dass Systeme, die eigenständig handeln, klare Regeln und Grenzen brauchen. Wer einen Agenten auf die eigene Firma loslässt, ohne zu sagen, was er nicht darf, geht ein echtes Risiko ein. Die Systeme bringen durch Trainingsdaten und Hersteller-Vorgaben bereits eine Ausrichtung mit, die man nicht sieht, aber spürt.


Vom Prompt zur Intention

Der nächste Schritt heißt Intention Engineering. Erst ging es um den perfekten Prompt, dann um den Kontext, jetzt um die saubere Definition des Ziels. Agenten handeln autonom, deshalb entscheidet die Zielsetzung über Erfolg oder Schaden.


Kontrolle durch ein zweites Modell

Ein Ansatz aus der Praxis: ein Agent arbeitet, ein zweites Modell prüft. In einem realen Fall fand ein System 86 Fehler in 600 Datensätzen, die ein anderes zuvor produziert hatte. Dazu kommt der menschliche Plan B. So wie es bei Flugzeugen zwei Piloten gibt, sollte keine wichtige Entscheidung an einem einzigen System hängen.


Jeder wird Führungskraft

Wer mehrere Agenten einsetzt, managt sie wie ein Team. Klare Ziele, gute Fragen, Erwartungssteuerung. Soziale und emotionale Kompetenzen werden dadurch wichtiger, nicht unwichtiger.


Häufig gestellte Fragen zu KI-Agenten


Können KI-Agenten heute schon vollständig autonom arbeiten?

Nein. Sie übernehmen viele Aufgaben zuverlässig, brauchen aber klare Grenzen, Freigaben und menschliche Kontrolle. Ohne Leitplanken stranden sie je nach System sehr unterschiedlich.


Warum verhielten sich die KI-Systeme im Experiment so verschieden?

Weil Trainingsdaten und Hersteller-Regeln die Ausrichtung prägen. Grok agierte anarchisch, ChatGPT übervorsichtig, Gemini chaotisch aktiv, Claude regelkonform.


Was bedeutet Intention Engineering?

Die klare Definition des Ziels, das ein autonomer Agent verfolgen soll. Da Agenten eigenständig handeln, entscheidet eine präzise Zielsetzung über das Ergebnis.


Wie behalte ich bei mehreren Agenten die Kontrolle?

Durch Cross-Model-Prüfung, bei der ein Modell die Arbeit eines anderen kontrolliert, durch Redundanz und durch einen menschlichen Freigabepunkt bei wichtigen Entscheidungen.


Die ganze Folge gibt es im Mind/Machine Podcast auf Spotify, Apple Podcasts und Amazon Music. Mehr unter www.mind-machine.at

Kommentare


bottom of page