Die neue Bild KI von ChatGPT Images 2.0 ist da!
- Manuela Machner

- vor 3 Tagen
- 4 Min. Lesezeit
Aktualisiert: vor 2 Tagen
Heute hat Sam Altmann von OpenAI die neue Version von ChatGPT Bildern - Images 2.0 präsentiert und große Versprechungen gemacht und es als die beste Bild KI bezeichnet! Daraufhin musste ich seine Highlights gleich testen. Allen Ladezeiten zum Trotz findet ihr hier die Versprechungen und die aktuellen Ergebnisse.
KI-Bilder mit fehlerfreiem Text? Typografie in ChatGPT 2.0
Bisher scheiterten KI-Modelle oft an einfachen Wörtern. Die neue Bild KI von ChatGPT Images 2.0 beherrscht nun komplexe Layouts, ganze Absätze und verschiedene Sprachen ohne Tippfehler. Wirklich?
Beispiel: Erstelle ein Tech-Magazin Seite, auf der das neue Bildgenerierungsprogramm von Sam Altmann vorgestellt wird.
⭐⭐⭐⭐
Auf der Zeitung sollen gleich Beispiele gezeigt werden:
wie eine Speisekarte
Markttrends
mich in diversen Situationen (es hatte ein Basisbild von mir)
Vorher - Nachher eines Raums
und wie sich herausstellte die größte Herausforderung der QR-Code auf meine Homepage
Ergebnisse:
Text: 2 Tippfehler (ChatGPT hat in seinem eigenen Namen Fehler gemacht ;-) ⭐⭐⭐⭐
Echte Gesichter: Ein Fehler, der mir nun nicht so leid tut, ChatGPT hat meine Falten geglättet und mich schlanker und jünger gemacht. ⭐⭐⭐½
QR-Code im Bild ... und nun zum Hauptproblem, dass mich rund 20 Fehlversuche kostete. ChatGPT kann ja grundsätzlich QR Codes erstellen, aber das Bildgenerierungsprogramm erstellt nur das Bild eines QR Codes, der aber nix wert war. Und der Versuch es auszutauschen brachte: QR Code über Bild, Elemente gedoppelt, ... am Ende haben wir aufgegeben. Die Kombination technischer QR Code und Design hat nicht geklappt. ❌

Beispiel: Erstelle ein Linkedin Carousel mit 7 Carouselbilder.
Rund um dieses Thema, sollte ein Carousel. Wobei ich den Inhalt vorgegeben habe. ⭐⭐⭐⭐
Versuch 1: er hat alle Carouselbilder in ein Bild gepackt - Aufgabe nicht wirklich verstanden.
Versuch 2: er hat einzeln die Bilder erstellt, ich musste aber für jedes Bild den Auftrag händisch geben.
Qualität: Super!
Thinking Mode für Bilder - Recherche basierte Grafiken
Dieser Modus ist für Plus-Nutzer verfügbar. Die KI nutzt Web-Recherche, um sicherzustellen, dass die Inhalte (z.B. Daten in Infografiken) korrekt sind.
Aufgabe: Recherchiere und erstelle mir eine Infografik über die Entwicklung der Ankünfte und Nächtigungen 2016 - 2024 in Österreich
⭐⭐⭐⭐⭐
Ergebnis sieht Top aus, er hat (auf Nachfrage) auch die Detailquelle ausgegeben, da ich hier mir selbst aber die Zahlen erst händich herausholen müsste, habe ich die Kontrolle heute mal gelassen. Geminis Überprüfung hat ergeben, dass sie stimmen sollten. Was sagt ihr?

Konsistente Charaktere und Serien - Storytelling mit KI
Das Problem der „springenden Gesichter“ ist gelöst. Images 2.0 kann dieselbe Person in verschiedenen Situationen und Stilen konsistent darstellen.
Aufgabe: Erstelle ein Comic mit einem Robotermädchen dass die Highlights in Österreich entdeckt.
⭐⭐⭐⭐⭐
Einfach Gut, ich würde in Wirklichkeit im Vorfeld die Orte und Texte definieren und das Mädchen, aber einfach cool.

Visuelle "Beratung" und Produktplatzierung – Visual Understanding
Du kannst jetzt Fotos hochladen und die KI anweisen, diese zu bearbeiten oder darauf basierend Vorschläge zu machen. Also "Wie sieht Kleidung an mir aus", "Richte den Raum ein", "Werbebild von einem Produktfoto".
Aufgabe: Überlege dir ein Bildkonzept für dieses Produkt, analysiere es zuerst und dann entwickle das perfekte Bild mit diesem Produkt und dem Logo.
⭐⭐⭐⭐⭐
Ja - Ergebnis: sprachlos (bin ich selten) - wie man aus so einem schlechten Basisbild und so wenig Infos so ein gutes Ergebnis erstellen kann, unglaublich. Nicht nur, dass ein Bild erstellt wurde, sondern auch die Infos dazu recherchiert und umsetzen. Also meinen Canva-Account werde ich wahrscheinlich kündigen.

Formate für jeden Zweck: Vom Storyformat zu 360-Grad-Panoramen
Die Flexibilität bei den Formaten wurde massiv erhöht. Damit auch einer der großen Besonderheiten im Vergleich zu Nano-Banana von Gemini. Von extremen Breitbildern für Website-Banner bis hin zu 360-Grad-Ansicht. Und im Bearbeitungsmodus könnt ihr die Bilder anpassen auf: Quadratisch 1:1, Querformat 5:4, Story 9:16, Ultrabreit 21:9, Breitbild 16:9, Querformat 4:3, Breit 3:2, Standard: 4:5, Hochformat 3:4, Hochformat 2:3
Aufgabe: Erstelle das Bild eines Beagle der entlang eines langen Zaunes geht, im Ultrabreitformat 21:9 - danach im Bearbeitungsmodus im Storyformat 9:16

... und nun noch ein paar Versuche:
Kulinarikbilder
Ich war immer der Überzeugung, wenn KI-Systeme Salzburger Nockerl schaffen, dann können sie es wirklich. Ihr seht schon ganz gut -aber statt einen Backhenderlsalat wurde es ein Hendlstreifensalat und das Gösser ist ja schon ganz gut (außer, dass die Marke nicht mehr aktuell und auch nicht korrekt ist ;-)
Meine Einschätzung über Images 2.0?
Ich erstelle seit über 2 Jahren laufend KI-Bilder, meist fotorealistische, mit Tools wie Midjourney, Nano-Banana von Gemini, Flux und zahlreichen anderen. Die Bildgenerierungen in Images 2.0 sind wirklich meistens besser. Probleme habe ich unter anderem bei so wiederholenden Hintergründen (das Gras beim Beagle) gesehen, das eigentlich bei anderen Programmen nicht oder kaum existiert.
Ist das neue KI-Bildgenerierungsprogramm von ChatGPT derzeit das beste?
Ja, aus heutiger Sicht sind die Bilder wirklich am besten.
Was hat mich überrascht?
Die Anzahl der Personen hat in einem Bild gestimmt!
Sind die Bilder perfekt? Macht Images 2.0 keine Fehler mehr?
Nein, auch Images 2.0 macht noch Fehler, viel weniger, aber genau da liegt auch die Gefahr, denn es ist noch viel verführerischer die Bilder nicht mehr zu kontrollieren!
Kann man die Bilder bearbeiten?
So wie immer in ChatGPT könnt ihr das
Abschließend es hat Spaß gemacht, bis um 1 Uhr ChatGPT der Meinung war, dass ich "You're generating images too quickly. To ensure the best experience for everyone, we have rate limits in place." - Also Zeit für heute Schluss zu machen!




























Als intensiver Nutzer von ChatGPT erlebe auch ich aktuell einen bemerkenswerten Entwicklungssprung in der Bildgenerierung. Was vor kurzer Zeit noch wie ein technisches Experiment wirkte, ist heute ein ernstzunehmendes Werkzeug für professionelle Anwendungen – von Marketing über Präsentationen bis hin zur Markeninszenierung, insbesondere in der aktuellen Version der Bildgenerierung
. Besonders beeindruckend ist, wie präzise die Bildmodelle komplexe, natürlich formulierte Anweisungen umsetzen. Die Notwendigkeit für aufwendiges Prompt Engineering nimmt spürbar ab, was die Einstiegshürde deutlich senkt und die Effizienz massiv erhöht. Auch die Qualität der erzeugten Bilder ist auf einem Niveau angekommen, das in vielen Fällen unmittelbar produktiv nutzbar ist.
Gleichzeitig zeigt sich im täglichen Einsatz aber auch, dass die Technologie noch nicht vollständig ausgereift ist. Gerade bei der Integration…