Nachtrag: Besuch bei alten und neuen K.I.-Freunden

“K.I. - Kunst und Ich” ist nicht mein erster Tanz mit künstlichen Intelligenzen. Wie Eingangs erwähnt, wagte ich schon vor einem halben Jahr ein kleines K.I.-Projekt.

Damals illustrierte ich mit einer anderen Bild-K.I. das Musik-Video “Schweigen” für meine gute Freundin und zauberhafte Singer-Songwriterin Alexandra Janzen. Mein künstlicher Kreativ-Partner damals: Die Bild-K.I. “DALL-E 2”, kreiert von OpenAI, die auch Chat-GPT ins Leben riefen.

Ich konnte damals einen der begehrten Beta-Zugänge ergattern und wollte natürlich gleich erforschen, was sich damit alles anstellen lässt. Und war da schon baff erstaunt. Der gefühlvolle Ausdruck der DALL-E 2 Bilder hat mich völlig überrumpelt. In einen wahren Kreativrausch versetzt.

DALL-E 2 war damals in vielen Bereichen seinen digitalen Geschwistern meilenweit voraus. Als ich mit “Schweigen” anfing, war Midjourney gerade bei V3 angekommen. Daneben gab es einfach zugänglich kaum eine Bild-K.I., die da mithalten konnte.

Und DALL-E 2 konnte Hände! Für mich essentiell bei der Umsetzung von Schweigen.

Natürlich hat mich auch bei dem Projekt die Zeit rasant eingeholt. STABLE DIFFUSION betrat unter tosendem Applaus der Online-Community die digitale Bühne. Eine Bild-K.I., die Open Source ist. Für jedermann zugänglich und editierbar, der ein wenig technisches Know-How und einen leistungsfähigen Rechner mitbringt.

MIDJOURNEY machte zeitgleich den Quantensprung auf V4.

All diese K.I.s kommen in unserem Erklärbär-Video zu “Schweigen” zum Einsatz. Eine nette kleine Zeitkapsel für das, was damals schon möglich war.

Nur… Hände. HÄNDE! Konnte keine von den anderen K.I.s.

Heute, ein halbes Jahr später in Menschenzeit, Äonen in K.I.-Epochen, wollte ich mal kurz gucken, wie es meinen anderen digitalen Freunden geht. Und wo sie sich hin entwickeln.

Im Handgepäck: Zwei Werke aus meinem Buch, an denen sie sich versuchen durften. Zunächst einmal:

Ich darf nichts sein

Ich bin nichts. Ich bin nichts,
über das es sich vertieft zu reden lohnt,
das sich abhebt von dem alltageingewohnt
ganz banalen gipswandschalen Einerlei.

Ich bin nebenbei,
nicht im Zentrum, nicht im Abseits, einfach da,
ungewolltes hingenommen, nicht Gefahr,
nicht begehrenswertes Kleinod, einfach nur

frei und stur. Frei und stur!
Nur ein kleines unbedarftes Menschenkind,
traumvergilbte Blätter jagend mit dem Wind,
bis es selbst verweht, zerfleddert, fällt, und dann

als bunter Fleck im Farbenmeer verschwinden kann.

Chat-GPT Interpretation: "An impressionist painting of a lonely figure, sitting on a park bench in autumn, surrounded by falling leaves in warm earth tones. The figure is slouched and faceless, blending into the surrounding environment, symbolizing the feeling of being insignificant and unimportant. The overall color palette is muted, with hints of oranges and yellows to represent the fleeting beauty of life."

Und hier die Umsetzungen. Zu Anfang die Version für Buch und Lesung, MIDJOURNEY V4. Danach zum Vergleich: MIDOURNEY V3, DALL-E 2, die erste Testversion von vermutlich DALL-E 3 via BING, klassisches STABLE DIFFUSION über DREAMSTUDIO, als neuer Ableger INSTANTART.IO - Modell Anything V3, und zu guter Letzt, die neue MIDJOURNEY V5.


Mein alter Kreativpartner DALL-E 2 hat mich mal wieder überrascht. Die letzte Zeile, “…als bunter Fleck im Farbenmeer verschwinden kann”, kommt in dessen Bild am stärksten rüber.

Sein Nachfolger, jetzt gerade neu zugänglich über Microsofts BING, ist vielversprechend. Allein die Darstellung der Struktur der Ölfarbe auf der Leinwand… das hab ich in der Form noch nicht gesehen. Und auch der Ausdruck und die Symbolkraft sind stark. Ich seh schon, alter Kreativ-Kumpel, du wirst erwachsen.

In der Gesamt-Komposition gewinnt für mich aber weiterhin MIDJOURNEY V4. Von der Lichtgebung, der Stimmung, dem trotzigen Falschrum-Sitzen auf der Bank, dem fransigen Mantel, der selbst aussieht wie ein Herbstblatt… Hach.

MIDJOURNEY V5 hat auch was. Hier gefällt mir die laaaaange Bank, an dessen Ende unser Protagonist sitzt. Qualitativ wieder irre gut. Hat aber nicht den gleichen Charme, und eben nicht diese faszinierenden Flächen für Interpretation.

Die gute alte MIDJOURNEY V3… hat sich nach Kräften bemüht. Komplexe Szenen überfordern sie.

Und Stable Diffusion… nun, mein Rechner hat leider nicht die Power, um die neusten Iterationen zu betreiben. Ich bin also auf die Online-Versionen angewiesen. Hier einmal “Dream Studio”, welche auf dem klassischen Modell basieren. Ordentlich, aber nicht ansatzweise auf dem Level von Midjourney.

Und dann noch INSTANTART.IO. Ein kostenloser Ableger von Stable Diffusion, mit diversen Variationen. Hier das Modell “Anything V3”. Nicht unbedingt das, was ich für mein Buch oder die Lesungen verwenden würde, aber, ja, trifft das Konzept auf den Kopf.


Fein. Auf zur Runde zwei. Ich bin gespannt.

Vögel im Kopf

"Du hast doch'n Vogel"
Aye. Zwei oder drei,
die zwitschern und flattern, sind ständig dabei
in meinem verknöcherten Holzkopfgeäst.

Sie bauen aus Bruchstückgedanken ein Nest,
gesammelt weit hinter dem Horizont,
jenseits der gräulichen Wolkenfront,
die alles verhagelt, was ihr nicht beliebt.

Was bin ich doch glücklich, dass es bei mir piept.


Chat-GPT Interpretation: “An intricate ink illustration of a person's head with a bird's nest in their hair, surrounded by various birds of different sizes and colors, all intertwined with each other. The background features a subtle pattern of clouds and branches, creating a sense of calm and harmony.”

Die Umsetzungen. Gleiche Reihenfolge, MIDJOURNEY V4, MIDOURNEY V3, DALL-E 2, DALL-E Bing, DREAMSTUDIO, INSTANTART.IO - Anything V3, Zusätzlich INSTANTART.IO - Midjourney Inspired, MIDJOURNEY V5.


Hier läuft das ganze aus dem Ruder. Jede K.I. hat so ihre ganz eigene Interpretation. Unterschiedlichste Ansätze, wie eine “intricate ink illustration” auszusehen hat.

DALL-E 2 verabschiedet sich vom komplexen Part und präsentiert eine recht rudimentäre Zeichnung. Dall-E Bing macht nen ordentlichen Job, packt mich aber diesmal nicht. DREAMSTUDIO läuft in Richtung Cover-Art. Instantart.io mit Anything V3 gibt Vollgas Anime, im Midjourney-inspirierten Modell so ein bisschen Horror. MIDJOURNEY V5 übertreibt es maßlos mit den Vögeln. MIDJOURNEY V3 ist bemüht, aber noch nicht ganz da… Das einzig ausgewogene Bild, wieder von MIDJOURNEY V4.

Was mich fasziniert. Jede K.I. hat ihren eigenen Stil. Lege mir wie hier verschiedene Bilder zum gleichen Prompt von diesen K.I.s vor, und ich kann dir recht zuverlässig sagen, welche K.I. welches Bild ersonnen hat.

Was MIDJOURNEY V4 für mich und mein Projekt so wertvoll macht: Sie trifft so gut wie jeden Prompt (so lange keine vermaledeiten HÄNDE vorkommen). Die anderen K.I.s treffen, oder rauschen vorbei ins Irgendwo.

Zurück
Zurück

Update 2: Midjourney V5 - Mehr ist weniger (für meine Belange)