Legyen a márkádnak saját AI influencere, aki bemutatja a termékedet! Hihetetlenül hangzik, de lehet a márkádnak egy olyan saját AI influencere, ami mindig pontosan azt csinálja, amit te szeretnél, annyi tartalmat állít elő a termékedről, amennyit csak akarsz, és mindezt nagyon gyorsan, és hihetetlenül olcsón teszi. Jól hangzik, igaz? A jó hír, hogy az AI technológiával mindez lehetséges, ám egy kis trükközésre szükség van hozzá!
AI által generált, beszélő karakterek elkészítésére már többféle, jól működő megoldás is létezik, és nem is ez jelenti a fő kihívást, hanem a termék valósághű megjelenítése a videóban. Sajnos mind a kép- mind a videógenerálás során egyelőre kihívásokkal küzdd a mesterséges intelligencia, ha a termék pontos mását szeretnénk viszontlátni. Hétről-hétre javulnak ugyan a különböző alkalmazások és generatív AI modellek, de még mindig trükkös munkafolyamatokat kell kialakítani, ha pontos termékmegjelenítést szeretnénk elérni.
Képgenerátorok
Képgenerálás során kipróbáltam többféle modellt és workflowt:
- FLUX.1 Redux és FLUX.1 Fill kombinációit inpainting technikával
- Google Imagen 3
- Google Whisk
- ChatGPT
Mind közül a ChatGPT-vel lehetett a legpontosabb, de nem 100%-ban tökéletes eredményt elérni a képen.
Videógenerátorok
Mind a KlingAI 1.6-ban és a Hedra Character 3-ban is torzultak a termékek a videógenerálás során, bár ez utóbbi a legjobb a karakterek megmozgatására, mert élethűbb, jobban mozgó karaktereket és szebb szájmozgást tudott létrehozni, így végül ezt használtam, egy kis trükkel. A végső workflow így nézett ki:
Final workflow
- Beszereztem nagyfelbontású termékfotókat.
- A ChatGPT-vel megírattam a promptokat a kép- és videókészítéshez. A promptok tartalmazták a karakter kinézetét, a karakter szövegét, a terméket, és a jelenetet.
- ChatGPT-vel legeneráltam a karakter+termék képet, amit croppoltam 9:16 méretarányra és felskáláztam ComfyUI-ban. Ez adta az input képet a videógeneráláshoz.
- Hedra Character 3-mal legeneráltam a videót az input kép alapján, majd elkészítettem a hangot és a lipsyncet.
- Mivel a videógenerálás során torzult a termék, ezért DaVinci Resolva-ban rákompozitáltam a videó input képből a terméket a videóra. (Fontos, hogy a termék mozdulatlan legyen a videón.)