Bilder schreiben – mit KI.
Ist es nicht etwas müßig über KI in Grafik, Fotografie und Illustration zu schreiben – angesichts der gewaltigen gesellschaftlichen Umwälzungen, die KI generell verursachen wird? Für mich nicht, denn viele Unzulänglichkeiten, die einem als User bei Midjourney AI begegnen, scheinen auch die Unzulänglichkeiten der KI im Allgemeinen zu betreffen. Mit anderen Worten: Ich würde mich noch nicht von einer KI operieren lassen. Aber vielleicht bald, denn sie lernt sehr schnell.
Du hast einen Wunsch frei? Vergiss es!
Immer wenn ich als Texter eine außergewöhnliche Bildidee für ein Konzept hatte, habe ich mir früher gewünscht, genau das Bild in meinem Kopf sofort in eine Datei umwandeln zu können. Ohne Kompromisse eingehen zu müssen.
Davon ist KI noch weit entfernt (und zum Glück kann sie auch noch nicht Gedanken lesen). Aber meine ersten Tage als Midjourney Abonnent zeigten mir etwas anderes: KI ist beileibe noch nicht perfekt.
Ein Pärchen im Restaurant. Nur schlecht, dass der Herr seine Hand mitsamt der sechs Finger in der Suppe hat.
Ein Learning:
Außergewöhnliches braucht oft außergewöhnlich viel Zeit und Geduld.
Keine Frage, KI kann bei Illustrationen oder fotorealistischen Bildern Großartiges leisten, wenn man „nur“ ein eindrucksvolles Bild braucht. Dann generiert sie ein Plattencover nach dem anderen. Aber sobald der Wunsch nach einem Bild zielgerichtet ist oder aus der Norm gerät, wird es kompliziert. Weil die KI es noch nicht vermag, klare Befehle umzusetzen. Oder anders gesagt: Weil KI nach Regeln funktioniert, fällt es ihr schwer, Regeln zu brechen.
Was aber schwierig ist: Denn gerade das Brechen von Regeln schafft manchmal die Bilder, die gute Werbung braucht.
Es ist aber auch klar, dass nicht nur die AI lernen muss – ich muss es auch. Manchmal verstehen wir uns eben noch nicht – die KI und ich. Weil ich Begriffe eingebe, die sie ganz anders deutet. Sie erinnert mich manchmal an ein unkonzentriertes Kind, dessen Gedanken dauernd abschweifen. KI wie „Kein Interesse“. Dennoch hoffe ich, dass wir uns mit der Zeit aufeinander zubewegen. Weil die KI ja täglich besser wird.
Wenn die KI störrisch bleibt. Ein Beispiel.
Für meinen Freund Le von Le´s Sushibar habe ich mir eine Illustration im Stil des berühmten japanischen Malers Hokusai gewünscht, in der ein japanischer Drache mit einem großen Fisch kämpft. Heraus kam das:
Ein tolles Bild, aber leider sind hier zwei Drachen zu sehen. Obwohl ich noch mehrfach das Wort „Fisch“ bzw. „fish“ (auch im mehreren Umschreibungen) in meinen Prompt eingab, änderte die KI ihre Meinung nicht. Die beiden Drachen wären zwar die Zierde jeder japanischen Speisekarte, aber sie waren nicht das, was ich wollte.
Aber eines ist auch klar: Hätte mein Kunde nicht gewusst, dass ich ursprünglich etwas anders im Kopf hatte, wäre er wahrscheinlich sehr zufrieden gewesen. Und das nach ca. sechs Prompts (Befehle), die mich insgesamt 30 Minuten gekostet hatten. Ein guter Illustrator hätte dafür mindestens eine Woche benötigt – allerdings dann mit Fisch. Und erst nach einigen Versuchen und dementsprechender Rechnung.
Man sieht, dass der konkrete Wunsch nach einem bestimmten außergewöhnlichen Motiv, von der KI nicht unbedingt erfüllt wird. Andererseits benimmt sich die KI oft so, als wäre sie auf Drogen. Zum Beispiel, wenn sie eine Frau in einem roten Cabrio zeigen soll:
Wie man sieht, bricht die KI doch Regeln. Aber leider die Falschen. Ich bin mir auch nicht sicher, wie schnell sie hier lernen wird. Betrachtet man zum Beispiel das KI-Thema Autonomes Fahren, so sind die letzten Meter zur Perfektion die schwierigsten. Hier crasht es noch häufig. Was mir an diesem Bild auch aufgefallen ist: Hier ist hier eindeutig ein Mercedes zu sehen. Wird später in grafischen KI-Programmen Product-Placement üblich sein? Das Liebespaar mit eingespielter Coca-Cola-Werbung im Hintergrund?
Dein Wunschbild wird „Prompt“ erledigt. Oder auch nicht.
Auf der Suche nach einem außergewöhnlich schwierigen Testmotiv fiel mir mein Freund Uwe ein. Er ist begeisterter Fliegenfischer. Also kam ich auf die Idee den Begriff „Fliegenfischen“ wörtlich zu nehmen und bildlich umzusetzen: Zwei Fliegen, die fischen.
Also gab ich folgenden Prompt ein: „Zwei schwarze Fliegen sitzen am Fluss und angeln“. Heraus kam Surreales:
Also versuchte ich etwas genauer zu werden: „Zwei Fliegen sitzen am Flussufer und angeln Fische“. Naja, das war es auch nicht…
Ich überspringe jetzt viele, viele Promptversuche und komme zu dem Prompt, der mich zumindest in die Nähe meines Wunschbildes geführt hat. Er lautete so:
„Es ist ein märchenhaftes Foto mit zwei Angelruten: Zwei freundliche und lächelnde schwarze Stubenfliegen mit den typischen sechs Beinen sitzen an einem See und angeln, ihre Sitzhaltung ist aufrecht als ob Menschen sitzen würden, mit zwei ihrer sechs Beine halten sie jeweils eine Angelrute, die Angelschnur hängt im See, die Angelruten sind gerade und deutlich sichtbar, die Angelruten müssen aufrecht sein, die Stubenfliegen halten die Angelruten mit ihren Beinen, Angelrute, sie sehen aus wie zwei Menschen, die nebeneinander sitzen und angeln, nur dass es zwei Stubenfliegen sind, es ist ein Märchenbild, neben den schwarzen Stubenfliegen steht ein kleiner Korb mit Fischen, es ist ein schöner Sommertag, es ist ein schönes Bild von zwei Anglern, nur dass die Angler zwei Stubenfliegen sind, zeige zwei Angelruten! die Stubenfliegen müssen wie realistische Stubenfliegen aussehen, mit transparenten Flügeln auf dem Rücken und jeweils sechs Beinen, die sechs Beine und die Flügel müssen zu sehen sein, zeigen sie in sehr dramatischer und lustiger Aktion, fotorealistisch, hyperrealistisch“
Übrigens habe ich auch zeitweilig mit den Befehlen gearbeitet („—no people“), die Midjourney empfiehlt. Aber erst die obenstehende Anleitung für Begriffstutzige hat die KI auf den Weg gebracht.
Fliegen fischen
Hat man sein Wunschbild einigermaßen gefunden, kann man auch verschiedene Bildstile ausprobieren:
Die ganze Aktion hat mich acht Stunden gekostet, aber ziemlich viel Spaß gemacht.
Jammern auf hohem Niveau gehört dazu.
Allen Unzulänglichkeiten zum Trotz: Grafik mit KI ist beeindruckend! Und wenn die Ungenauigkeiten (wie die berühmten sechs Finger an einer Hand) beseitigt sind, wenn die Prompts einfach und logisch einzugeben sind und wenn man bei einem bestehenden Bild korrigierend eingreifen kann, ist KI die Wunderdroge für alle Kreativen.
Doch ist man auch kreativ, wenn man mit KI arbeitet?
Das ist eine grundlegende Frage, die es auch im Urheberrecht zu klären gilt. Ich denke, es kommt darauf an: Wenn ich den Bildwunsch „AI and industry“ eingebe und mir die die KI ein fast perfektes Bild liefert, liegt die kreative Leistung klar bei der KI:
Ai and industry – made by Midjourney
Doch je mehr ich das Bild durch mehr und mehr komplexe Prompts zu meinem eigenen mache und je mehr ich die KI zu einem Instrument meiner kreativen Ausdrucksweise mache (Bleistift, Pinsel oder ein grafisches Programm), desto größer wird auch mein eigener kreativer Anteil. Vielleicht muss es dann urheberrechtlich heißen „Prompted by Daniel Speer at Midjourney AI“.
Wie z.B. hier:
Zurzeit arbeiten hier viele kluge Köpfe an einer Lösung und ich hoffe, dass diese nicht zu überreguliert ausfallen wird. Ich persönlich würde mir wünschen, dass ein KI-generiertes Bild einen menschlichen Urheber hat, der auch die Verantwortung dafür trägt, was mit dem Bild passiert.
So weit, so spannend.
PS: Während Du meinen Beitrag liest, ist KI bestimmt schon wieder besser geworden. Es geht wirklich sehr schnell.