top of page

Bildgenerierung mit Künstlicher Intelligenz - wenn die KI "malt"

Aktualisiert: 15. Jan.

Im Rahmen eines KI-Adventkalenders 2023 machte ich ein spannendes Experiment: Täglich nutzte ich verschiedene KI-Bildgenerierungstools mit dem gleichen Prompt, um möglichst realistische Bilder zu erstellen, die sich auf aktuelle touristische Themen konzentrierten. In diesem Blogbeitrag teile ich meine Erfahrungen und Erkenntnisse, um euch einen umfassenden Überblick über die Möglichkeiten der Bildgenerierung mit Künstlicher Intelligenz zu geben.


Folgende KI - Bildgenerierungs - Tools habe ich verglichen:


Vor meinem Experiment nutzte ich fast ausschließlich Midjourney und für weniger realistische Bilder Dall-E 3 bei ChatGPT. Runway setzte ich primär im Bewegtbildbereich und Canva für grafische Gestaltungen ein.


Meine Favoriten bei der Bildgenerierung mit Künstlicher Intelligenz


Durch diese Bilderserie nutzte ich die unterschiedlichen Programme sehr viel intensiver. Mein Favorit Midjourney liegt nun mit Leonardo.ai gleichauf - und seitdem Leonardo zu Weihnachten nun auch Bewegtbilder generiere kann, wird es wohl mein Lieblingstool werden. Völlig unterschätzt wird meiner Meinung nach außerdem "Magic Studio" von Canva - nicht nur die Bilder- sondern auch die Videogenerierungen (im Hintergrund von Runway) sind für zahlreiche Zwecke optimal einsetzbar.


Bei Illustrationen ist Dall-E 3 integriert in ChatGPT für mich der absolute Favorit. Vor allem, da ChatGPT eure Formulierung für ein Wunschbild auch gleich in den entsprechenden Prompt umwandelt und daraus ein Bild generiert. Eine tolle Funktion ist auch, dass du einfach über eine Texteingabe schreiben kannst, was du gerne anders haben möchtest und ChatGPT ändert den Teil (zwar meist auch das ganze Bild) aber verändert eben den Inhalt, den du anders haben möchtest.


Zu den einzelnen Tools, werde ich im Bereich Tools eigene Berichte schreiben. Hier nun ein paar Erfahrungen, die ich mit euch teilen möchte.


Mein Fazit: Fotorealistische Bilder: Leonardo.ai / Illustrationen: Dall-E 3 (ChatGPT)


Bildprompts für KI-Bilder:

  • Länge:  Kürzere Prompts sind oft effektiver, da die wichtigen Inhalte klarer hervortreten.

  • Formulierungen: Die Prompts, die in Sätzen: so wie ChatGPT das ja gerne macht, formuliert waren, haben aus meiner Sicht schlechtere Ergebnisse geliefert, als die stichwortartigen Prompts. Wichtig ist aber dennoch, dass die "Stimmung" des Bildes beschrieben wird. Mein Fazit: Stichwortartige Prompts liefern in der Regel bessere Ergebnisse als ausformulierte Sätze.

  • Sprache: Auf jeden Fall den Prompt in englisch übersetzen. Es können zwar einige Tools bereits deutsch, die Ergebnisse sind aber dennoch in der englischen Version besser. Daher im Notfall lieber übersetzen lassen, statt deutsch formulieren. Mein Fazit: Prompts in englisch verfassen!


Spannende Ergebnisse mit Künstlicher Intelligenz

  • Echte Personen: Ein Bild sollte Robbie Williams bei seinem Auftritt in Schladming darstellen. Einige Tools weigerten sich konkret die Person darzustellen, am spannendsten hat ChatGPT mit Dall-E 3 reagiert, so hat er selbständig den Prompt umgeschrieben und aus den Namen einfach "male musician" gemacht. Auch Firefly hat einfach irgendeine Figur dargestellt, abgesehen davon dass er von 8 Bildern 7 mal Frauen im Dirndl generiert hat, anstatt Robbie Williams.


Leonardo.ai - Robbie Williams in Schladming


  • Gesperrte Begriffe: die meisten Tools haben gewisse anzügliche Begriffe gesperrt, spannend wird diese Sperre, wenn englische Begriffe mehrere Bedeutungen hatten. So wollte ich ein Bild von einer Meise am Futterhaus. Doch der englische Begriff lautet "tit" und dieser wurde von einigen Tools (Firefly, Canva, Lexica, Deepdream, Imagine.art) gesperrt. Die meisten Programme erklären aber nicht, welcher Begriff nun nicht zugelassen ist, sondern erklären nur, dass man gegen die Richtlinien verstößt. Eine andere Situation wo ich das Problem hatte, war bei einem Versuch ein Bild von einem Schwimmbad mit planschenden Kindern in Badebekleidung zu generieren, auch bei diesem Thema sind die Bildgenerierungsprogramme sehr vorsichtig und sperren den Prompt.

  • Inhaltliche Bezüge: Spannende Ergebnisse kommen auch heraus, wenn dem Programm nicht ganz klar ist, auf was sich eine Eigenschaft bezieht. So wollte ich ein Treffen von Weihnachtsmann mit dem Christkind im weißen Kleid darstellen. Die meisten zogen daraufhin dem Weihnachtsmann ein weißes Kleid an ;-)


  • Realistische Bilder: Interessant wird es, wenn die KI die Realität besser zeigt, als man selbst möchte. Auf den Prompt: "realistische Bilder vom Adventmarkt zu zeigen" haben die guten Tools wie Midjourney und Leonardo auch wirklich realistische Szenen generiert. Adventmärkte wo kein Schnee liegt und das Wetter trübe und die Straßen feucht sind. Also für Imagebilder wieder weniger geeignet ;-)

Midjourney - Christkindlmarkt

  • Trainingsdaten: Bei typische österreichischen Motiven wird sehr schnell klar, woher die Trainingsdaten genommen werden, bzw. wo es wenig Daten gibt. So bekam der "Krampus" Elemente von Aliens und Spielcharakteren verpasst. Bei einem Keksteller mit Keksen - von Vanillekipferl bis Zimtsterne - ließ sich Midjourney nicht motivieren typisch österreichisches Gebäck zu "backen" sondern fabrizierte "Einheitskekse". Dafür sieht jedes 3. österreichische Dorf am See, dass man von einer Künstlichen Intelligenz generieren lässt, nach Hallstatt aus ;-)



Häufig gestellte Fragen zur KI-Bildgenerierung:



Wien im Schnee - Midjourney
  • Reale Orte: Kann man reale Orte von einer KI generieren lassen? Noch nicht wirklich zumindest noch nicht in Österreich, dafür ist die Anzahl der Trainingsdaten noch zu gering. Man kann als Vorgaben zwar Orte, Bergzüge, etc. vorgeben und dann wird es zB nach österreichischen Alpen aussehen, aber dass das wirklich der Gebirgszug ist oder dass der Stephansdom wirklich so aussieht, funktioniert noch nicht.

  • Rechte: Wer hat das Bildrecht? Ich bin keine Rechtsexpertin, doch bisher wird es so gehandhabt, dass weder die KI (weil sie keine natürliche Person ist) noch der Mensch der den Prompt geschrieben hat, das Recht darauf hat. Bitte aber unbedingt darauf achten, welche Rechte man mit der Nutzung der Bildgenerierungstool bekommt, ob für kommerzielle Zwecke oder nur für die private Nutzung. Manchmal ist es davon abhängig ob man die Pro-Version hat oder die Gratis-Version. Außerdem sind meistens (vor allem bei den Gratis Versionen) die Ergebnisse öffentlich und daher auch von anderen Usern nutzbar!

Welche KI- Bilder gefallen euch?

Macht euch selbst ein Bild. Ich zeige Euch hier einige Bilder, die ich mit den unterschiedlichsten Programmen generiert habe, die typische für die Programme sind und entdeckt für euch selbst, welches Tool ihr testen möchtet.


Der Prompt sollte die Panik widergeben, wenn Mann feststellt, dass es nur mehr 3 Tage bis Weihnachten ist! Auf jeden Fall viel Spaß beim Experimentieren!






59 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen

Comments


bottom of page