A megrendelőnek volt egy ötlete: az autómosóját szeretné látni 3D-s animációs rajzfilm stílusban, ahol animált állatkarakterek eljátszák az általa kitalált történetet. A megvalósítás során kialakítottam egy többlépcsős workflowt, és rengeteget tanultam belőle:
Valós helyszín átültetése 3D rajzfilm stílusba
Rengeteg ComfyUI workflowt leteszteltem a FLUX.1 modellhez, hogy megtaláljam a legjobb megoldást a valós helyszínről készült fotók 3D rajzfilm animációs stílusúvá alakításához. Kipróbáltam Depth és Canny ControlNET workflow-kat, de végül a Redux hozta a legjobb eredményt — ezt többféle LoRA-val kombináltam változó súlyozással.
Konzisztens karakterek
Az AI-generált munkafolyamatok egyik kihívása, hogy a karakterek, tárgyak és helyszínek konzisztensen jelenjenek meg több képen vagy snitten keresztül. Ehhez kifejlesztettem egy workflowt, amelyben a karaktereket több szögből is nagyfelbontásban generáltam. Ezt Google Imagen 3-mal és különböző felskálázási módszerekkel értem el.
Minél tisztább bemenet
A sikeres képgenerálás kulcsa a tiszta bemenet. Minél letisztultabb a kiinduló kép, annál kisebb az esélye, hogy az AI oda nem illő részleteket épít bele. Ezért fontos, hogy mielőtt bekerül a workflowba az adott nyersanyag, retusáljuk a képet, eltávolítva a szükségtelen elemeket.
Improvizáció
Az AI tökéletlen, nem mindig érti meg pontosan, hogy mit szeretnénk látni, vagy egyszerűen nincsen meg az eszköztárában az az eredmény, amit látni szeretnénk. Ha a sokadik promptverzióra sem sikerül elérni a kívánt eredményt, improvizálni kell. Néha el kell engedni egy ötletet, és olyan megoldást keresni, amit az AI sikeresen le tud generálni. Ezért fontos a rugalmasság mind a készítők, mind a megrendelők részéről.
Mire képes a KlingAI Elements?
A gyártás során alaposan leteszteltem a KlingAI Elementset, ami maximum 4 bemeneti képből tud videót generálni. 3 elemmel jól működött, de 4 elemnél gyakran zavarossá vált: összekeverte a karaktereket, kihagyott elemeket, vagy furcsa eredmény született.
Pontos promptolás
Minden AI eszköz saját promptstruktúrával dolgozik. Fontos, hogy ehhez alkalmazkodjunk, és jól ismerjük az adott eszköz lehetőségeit és korlátait. Ezen múlik, hogy megérti-e az AI, hogy mit szeretnénk látni.
A magyar nyelvű AI narráció kihívásai
Bár az angol nyelvű text-to-speech megoldások már nagyon kifinomultak, a magyar nyelvű narráció még mindig problémás. Kevés jól működő hang érhető el, és sokszor gond van a helyes hangsúlyozással és kiejtéssel is, ezért gyakran kell a szövegen módosítani, hogy természetesebb legyen az eredmény.
Az AI kreatív folyamatokban való alkalmazása izgalmas lehetőségeket nyit meg, de rugalmasságot, kísérletezést és folyamatos tanulást igényel.