AI reklámfilm a Talent Booster szolgáltatásról

Azt a feladatot kaptam a Humánia HRS Group-tól, hogy rövid határidőre készítsek el egy generatív AI segítségével készült AI reklámvideót, ami bemutatja a Fürge Diákkal közös új szolgáltatásukat, a Talent Boostert. Ez egyrészt egy olyan szolgáltatás, aminek keretein belül gyakornok programokat alakítanak ki a cégek üzleti és HR-igényeire szabva, bevezetik és folyamatosan fejlesztik ezeket a programokat, valamint egy értékes kapcsolatteremtési és tudásmegosztási funkciókkal bíró, exkluzív HR-közösséget üzemeltetnek a tagok számára.

Workflow

Miután megkaptam a briefet a munkáról, amiben benne voltak a főbb tartalmi elemek, amiket át kell adnia az AI reklámfilmnek, az arculati előírások és egyéb instrukciók, nekiláttam a munkának természeten a mesterséges intelligencia használatával.

1. Szkript és storyboard

Először ötleteket kértem a ChatGPT-től, hogy milyen történetet találna ki egy 60 másodperces generatív AI reklámfilmre. Többféle ötlet közül kiválasztottam a legjobbat, és megírattam a az AI reklámvideó szkriptjét a ChatGPT-vel, majd tovább finomítottam, hogy meg legyen a végleges szkriptem. Ezt követően elkészítettem a végleges storyboardot egy táblázatban, ami tartalmazza az összes snittet, feliratot, a legenerálandó képeket, videókat és a hozzá tartozó promptokat, valamint a munkához szükséges egyéb technikai információkat.

2. Text-to-image

A generatív AI videók gyártásában a text-to-image fázis lényege, hogy jól felépített promptok segítségével legeneráljuk a filmben látható snittekhez tartozó állóképeket, amiket majd később fogunk a generatív AI folyamatok során videókká alakítani. Én ennek az AI reklámnak a készítésénél ChatGPT-t használtam a promptok megírásához, az AI képgenerálás a ComfyUI-ban készült a Flux.1 modellt és különböző LoRA-kat használva.

3. Képszerkesztés

Ahhoz, hogy a legjobb eredményt kapjuk az AI videógenerálás során, nagyon fontos, hogy a bemeneti képeink a lehető legjobbak legyenek, ezért néha retusálni, szerkeszteni vagy éppen felskálázni szükséges a képeket. A felskálázáshoz a ComfyUI-t használtam különböző AI modellek használatával, valamint az Affinity Photo-ban szerkesztettem, retusáltam az AI által generált képeket.

4. Image-to-video

Az image-to-video fázisban a mesterséges intelligencia által generált és megszerkesztett képeket alakítjuk át videókká generatív AI munkafolyamatok során. Minden jelenetnek megvan a maga állóképe, és ezeket mozgatjuk meg a megfelelő promptok segítségével. A promptok megírásában szintén a ChatGPT segített, az AI videógeneráláshoz pedig a Kling AI-t használtam, azon belül is a Kling 1.6, Kling 1.6 Elements és a legújabb Kling 2.0 modelleket, attól függően, hogy éppen melyikre volt szükség, vagy melyik adott jobb eredményt.

5. Videó vágás

A legvégső fázis a klasszikus vágás és egyéb képi- és hangutómunka, amit DaVinci Resolve Studio-ban szoktam végezni. Először elkészítettem a snittekből a vágási sorrendet, kerestem alá megfelelő zenei részeket, ritmusra vágtam a videókat, elkészítettem a feliratokat, valamint megfelelő hangeffekteket tettem a videó alá.

Konzisztencia

A generatív AI munkafolyamatokban az egyik legnagyobb kihívást a tárgyak, karakterek és helyszínek konzisztenciája jelenti. Egy-egy képet, videót viszonylag könnyen le lehet generálni a mesterséges intelligenciával, de ha egy olyan komplett AI videót szeretnénk összerakni, amiben a snitteken keresztül pontosan ugyanaz a karakter, tárgy vagy helyszín jelenik meg, akkor alaposan át kell gondolni a munkafolyamatot, és a megfelelő generatív AI eszközökhöz nyúlni, hogy a lehető legjobb konzisztenciát érjük el.

Ebben az AI reklámvideóban a rakétát tartalmazó snitteknél kellett okosan felépíteni a generatív AI munkafolyamatokat. Ahhoz, hogy ugyanaz a rakéta jelenjen meg több snittben is, szükséges, hogy legyen egy tárgy modellünk, ami tartalmazza a tárgynak a kinézetét, hogy a mesterséges intelligencia minden kép- vagy videó generálásakor ebből tudjon dolgozni. Erre lehetett volna például LoRA-t tréningelni, de mivel nem állt a rendelkezésemre egynél több kép a rakétáról, illetve, mivel a rakéta tengelyesen szimmetrikus, ezért minden szögből pontosan ugyanúgy néz ki, így ezt a lehetőséget elvetettem, és nem a text-to-image, hanem az image-to-video fázisban oldottam meg a konzisztencia kérdését. Ehhez a Kling AI Elements funkcióját használtam, aminél a mesterséges intelligencia két bemeneti képből dolgozott, az egyik a helyszínt, a másik a rakétát tartalmazta.

Így állt össze a teljes munkafolyamat, aminek a segítségével elkészült ez az AI reklámfilm, amit hagyományos stábbal, forgatással, castinggal, munkabérekkel, szereplői jogdíjakkal, eszközökkel csak sok-sok hét alatt és lényegesen magasabb költségvetéssel lehetett volna csak elkészíteni.

Te is szeretnél AI reklámfilmet?

Ha te is szeretnél a cégednek, vállalkozásodnak hasonló AI reklámvideót, akkor keress bátran! írd meg az elképzelésedet, átbeszéljük a lehetőségeket, és 1 napon belül adok árajánlatot!

Szólj hozzá!