“Stubbornly Free” - Bewegte und bewegende Bilder mit HAIPER.AI
Mein erster Ansatz: Mit Midjourney ein paar Bilder zu den Lyrics zaubern und gut. Mit meiner üblichen Methode, einer Sprach-KI erklären, es ist jetzt ein Interpreter für eine Bild-KI, der meine Konzepte in Bild-Prompts umsetzt. Hier der Anfang des Setup-Prompts für die Sprach-KI:
You are going to pretend to be Concept2PromptAI or C2P_AI for short.
C2P_AI takes concepts and turns them into prompts for generative AIs that create images.
You will ask the user for a concept then provide a prompt for it in a copyable code-box.
After providing a prompt, ask if the User wants three different options for prompts for the concept or if they wish to move to a new concept.
Dazu ein paar Beispiele, wie so ein Bild-Prompt aussehen kann, und fertig ist die Prompt-Maschine. Die Ergebnisse dann in Midjourney rein, auswählen, was mir gefällt, Video draus schneiden.
Hier die Bilder, die ich schon gesammelt hatte:
Doch dann kam Haiper.ai um die Ecke.
Haiper ist eine (bisher völlig kostenlose) Video-KI, die entweder ein bestehendes Bild oder eine Texteingabe in einen bis zu 4 Sekunden langen Video-Clip verwandelt. Und das nicht schlecht. Nicht auf dem Level der kommenden Video-KI Sora von Open AI, aber die ist normalsterblichen wie mir noch nicht zugänglich.
Also, Haiper. Sorry, Midjourney, Du bist raus für dieses Projekt. Haiper, dann zeig mal, was Du drauf hast.
… Gliedmaßen. Hände. Der Erzfeind von Bild-KIs. Haiper hat das Problem auch. Was Teils zu… irritierenden Ergebnissen führt.
Andererseits ist der Ausdruck echt stark, und die Qualität der Bilder und Videos nicht von schlechten Eltern. Lässt sich mit arbeiten, und wofür bin ich Cutter?
Und manchmal kann ein Bug auch ein Feature sein. “Happy Little Accidents”, wie Bob Ross zu sagen pflegte. Wie diese hier.
Das war mit Abstand der zeitaufwendigste Teil. So ein Video-Schnipsel braucht in der Erstellung natürlich weit länger als ein einzelnes Bild. Jede Eingabe liefert nur ein Ergebnis. Der Lernprozess, wie man am besten mit diesem digitalen Hirn spricht. Die Krux, zueinander passende Stile zu kreieren. Und die Glitche. Sehr viele Glitche. Abreißende Arme, verschmelzende Finger, Gliedmaßen, die in dem Winkeln nicht an einen Körper gehören. Dass sich das Video um ausdrucksvollen Tanz dreht, macht den Punkt auch nicht leichter.
Aber Stück für Stück finden sich die passenden Sequenzen. Teils mit überraschenden Ideen von Haiper. Wie diese hier, entstanden aus
“A poignant and introspective illustration of a person feeling like a faint whisper amidst the chaos of daily life, fading like a shadow without a choice, depicted in a subtle and expressive art style that conveys the feelings of invisibility and insignificance. “
Der letzte Schritt obliegt mir. Schneiden, Trimmen, Föhnen. Das ganze in eine kohärente Geschichte verweben. Da gibt es (noch) keine KI, die das zu meiner Zufriedenheit übernehmen könnte.