KI generierte Models: Hybrid workflow

Ein Hybrider Ansatz mit Midjourney, Cinema 4D und Photoshop

KI generiertes Model mit gerendertem Anhänger aus Cinema 4D

KI Models kommen: Die Frage ist nur wann und wie.

Das Mode Label Mango hat vor kurzem vorgelegt und für eine Werbekampagne für ihre Teenager Kollektion mit KI generierten Modells gearbeitet. Was das für die Werbebranche und uns Freelancer bedeutet habe ich in einem anderen Beitrag versucht einzuorden.

Verschiedene Workflows mit KI Models

Mango hat beispielsweise die KI mit Fotos ihrer Kleidungsstücke trainiert, um dann von der KI fertige Bilder des Modells in diesen Kleidungsstücken generieren zu lassen.

In meinem Fall ließ ich die KI Midjourney Bilder von Damen mit Anhängern an Lederbändern generieren und ersetzte diesen Anhänger anschließen in Photoshop durch einen aus der passenden Kameraperspektive fotorealistisch 3D gerenderten Anhänger aus der 3D Software Cinema 4D (inklusive Corona Render Engine).

Hier ein Beispiel: KI Modell plus Oktopus Anhänger von Schmuckbekenntnis.com

Das KI generierte Bild in Cinema 4D mit 3D Modell des Anhängers und Kamera
Das finale Bild

Mein Workflow war also noch um einiges “hybrider” bzw. “klassischer” als der bei Mango, allerdings wurde auch hier der Bild-Output der KI noch in einem abschließenden Schritt herkömmlicher Bild-Postproduktion verfeinert.

Der Teufel steckt gerade bei KI generierten Inhalten im Detail. 

Je spezifischer und konkreter die Vorstellung des Art Directors bzw. Kunden, desto schwieriger wird es.

Das Fixen von Details per Prompt oder auch das Inpainting plus Prompt (a la Adobe Firefly) sind zumindest in Midjourney V6 noch ausbaufähig. Wenn alles Prompten nicht mehr hilft, muss doch mit 2D oder auch 3D Tools nachgebessert werden oder man trainiert das KI-Modell gleich mit eigenen Inhalten wobei hier der Aufwand exponentiell höher ist, wie bei den gängigen Text to Image Bildgeneratoren wie Dall-E 3, Midjourney, Flux usw. 

KI Bildgeneratoren werden definitiv ein immer mächtigeres Tool werden, allerdings unterliegen sie zumindest, wenn es um die Ausarbeitung konkreter Details geht, noch klar dem Pareto Prinzip. Heißt: Man bekommt in 20% der Zeit 80% des gewünschten Bildinhaltes erzeugt. Für die restlichen 20% des Jobs – die Details und den Feinschliff – benötigt man dann aber plötzlich nochmal 80% der Zeit.

Das wird sich allerdings garantiert angesichts der rasanten Fortschritte im KI Bereich innerhalb der nächsten 2 – 5 Jahre ändern.

Bei manchen Dingen fehlt es noch weit. 

Es ist allerdings so, dass die vor allem von amerikanischen Tech-Firmen bereit gestellten KI-Bildgeneratoren im Jahr 2024 offensichtlich teilweise noch nicht alle “Hausaufgaben” gemacht haben. Es gibt Bereiche bzw. spezifische Objekte aus dem deutschen bzw. europäischen Kulturraum, bei denen die KI wohl noch nicht auf genug Trainingsdaten zugegriffen hat um passende Resultate zu liefern. 
Hier zu nennen beispielsweise “Stein Masskrüge”. Einen simplen 1 Liter Maßkrug aus Steinzeug wie er auf traditionellen bayerischen Volksfesten anzutreffen ist, zu generieren fiel der KI Midjourney zumindest im Frühjahr 2024 noch mehr als schwer. Egal welcher Prompt. Es war immer schlicht “too much”. Hier ein zwei Beispiele:

Midjourney Prompt: "two very simple bavarian stone beer jugs white background, 3d render"
Midjourney Prompt inklusive Bildprompt: "two very simple bavarian stone beer jugs white background, 3d render"

Mein Knock Out Kriterium: KI kann noch nicht Tracht

Ausschlaggebend für meine Entscheidung KI Modells vorerst nicht für die betreffende Schmuck-Kollektion einzusetzen, war dann auch ein anderer Bereich, den Midjourney wohl noch nicht komplett durchdrungen hat: Bayerische Tracht. 

Die Signature-Pieces der Kollektion, die Sterling Silber Anhänger “Kantenherz” und “Kantenbreze” sind u.a. einfach ein perfektes Accessoire für bayerische Trachtenträger und schon nach wenigen Prompt-Versuchen für die Oktoberfest-Kampagne wurde mir klar: Midjourney kann viel aber akkurate bayerische Dirndl und Lederhosen, das kann diese KI einfach nicht.

Noch nicht. 

Hier ein paar Beispiele. Bei genauerem Hinschauen wird klar: Diese “Dirndl” sind doch sehr seltsam. 

Midjourney Prompt: "brown haired girl 35 years old, studio shot, concrete background, curly hair, brown skin, smiling, wearing traditional bavarian dirndl cloth, very simple necklace, portrait, amateur photography, shot on I phone"
Midjourney Prompt: "brown haired girl 35 years old, studio shot, concrete background, curly hair, brown skin, smiling, wearing traditional bavarian dirndl cloth, very simple necklace, portrait, amateur photography, shot on Hasselblad X2D"

Weitere Arbeiten