Advanced level  10 - Állandó karakterek- (Consistent Characters)

Egy Állandó Karakter


Miért változik meg a karakterem arca minden egyes generálásnál?! - Ha foglalkoztál már MI képgenerálással, biztosan belefutottál ebbe a falba. Készítesz egy zseniális főhőst a mesekönyvedhez vagy a képregényedhez, de a következő képen már teljesen máshogy néz ki...

A text-to-image (szövegből kép) generálás során az egyik nagyon izgalmas és kedvelt  kihívás az állandó karakterek (Consistent Characters) létrehozása. Alapértelmezés szerint az MI minden promptra teljesen új arcot és alakot generál. Az alábbi oktatóanyagból megtanulhatod, hogyan tarthatod meg ugyanazt a karaktert különböző jelenetekben és ruhákban.

1. Módszer: A karakterleíró sablon (A legegyszerűbb út)
Ha nem akarsz külső funkciókat használni, a titok a szigorúan azonos, rendkívül részletes karakterleírás és a változó környezet szétválasztása.A módszer lépései:

  1. Alakíts ki egy fix "karakter-magot" (kor, nem, nemzetiség, haj, szem, egyedi ismertetőjel).
  2. Adj a karakternek egy egyedi, ritka nevet (pl. "A 25-year-old Hungarian girl named Zoey"). Az MI hajlamos összekötni a nevet a stílussal a generálási folyamat során.
  3. A prompt elejére mindig másold be a fix karaktert, a végére pedig a cselekvést és a helyszínt.
Példa Promptok (Midjourney / DALL-E 3 / Flux):
  1. Alapkarakter (Portré):

    Medium shot of a 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose, bright green eyes, wearing a simple white t-shirt, studio lighting, photorealistic.



  • Új jelenetben (Kávézó):

    Full body shot of a 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose, bright green eyes, wearing a black leather jacket, sitting in a cozy Budapest cafe, holding a coffee cup, cinematic lighting, photorealistic.


  • Más hangulatban (Esőben):

    Close-up of a 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose, bright green eyes, wet hair, yellow raincoat, walking under the rain at night, neon lights reflections, photorealistic.


2. Módszer: A Karakter-lap (Character Sheet) technika

Ez a technika ideális képregényekhez vagy mesekönyvekhez. Egyszerre generálunk le több szöget és arckifejezést egyetlen képen, amit később szét lehet vágni.

Példa Prompt:
Character sheet of a 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose. Showing multiple poses and expressions: smiling, angry, surprised, profile view, front view. White background, Pixar style, 3D render.


 3. NightCafe AI Consistent Characters (Állandó Karakterek)
 
A NightCafe beépített egy virtuális karakter-tárolót. Miután egyszer megtanítottad az MI-nek, hogyan néz ki a karaktered, egyetlen gombnyomással előhívhatod őt bármilyen új ruhában, pózban vagy helyszínen. 

Így találod meg és használod a NightCafe-ban

  1. Nyisd meg a stúdiót: Lépj be a NightCafe Creator felületére.
  2. Keresd a gombot: Kattints a szöveges prompt (szövegbeviteli) mezőben található "Add Character" (Karakter hozzáadása) gombra.
  3. Töltsd fel a bázist: A megnyíló ablakban tölts fel 1–4 referenciafotót a karakteredről. Minél több szögből van képed, annál pontosabb lesz az MI.

Referenciaképek készítése: 

Prompt: A 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose, bright green eyes, wears white T-shirt, photorealistic.

Prompt: "Character model sheet, multiple angles, a 25-year-old Hungarian girl named Zoey, short ginger bob haircut, freckles on nose, bright green eyes, showing neutral expression, front view, side profile view, three-quarter view, simple white t-shirt, solid light gray background, studio lighting, photorealistic."

  1. Nevezd el: Adj neki egy egyszerű nevet, például: zoey.
  2. Mentés: Kattints a mentésre.

Hogyan hívd meg a karaktert a promptban?
A mentés után a karaktered egy egyedi taget kap. Amikor új képet generálsz, csak írd be a @ jelet és a karakter nevét a promptba: pl: @zoey

  • Példa prompt: @zoey sitting on a bench in a futuristic neon city, cyberpunk style

  • Példa prompt: @zoey She is walking down a charming street in Budapest, smiling, wearing a stylish beige trench coat, autumn weather, soft natural daylight, photorealistic.
Az MI automatikusan beolvassa a mentett karaktered arcvonásait a háttérből, és ráilleszti az új jelenetre, így nem kell minden alkalommal újra feltöltened a forrásfájlokat, forrásképeket. 


2. Példa: Karakter alap:  Báziskép legenerálása (Ezt mentik el karakterként):

Prompt: "Portrait of a 28-year-old athletic man, sharp jawline, short dark brown undercut haircut, stubble beard, intense blue eyes, wearing a grey crewneck sweatshirt, clean studio background, photorealistic, 8k resolution."

Prompt kiegészítve: "front view, side profile view, three-quarter view,"

2. lépés: Az új jelenetek (Miután elmentették @Leo néven):

Akciójelenet: Prompt: @leo running through a neon-lit cyber city rainy street, cinematic action shot, cyberpunk style, high speed motion blur.

  • Nyugodt jelenet: @leo sitting on a mountain peak during sunset, looking into the distance, wearing a hiking jacket, warm golden hour lighting, photorealistic.

  • Látható, hogy milyen kimoly leírás szükséges a báziskép promptjában! 


    Az Állandó Karakterek Világa


    Összegzés és a tévhit eloszlatása:

    Sikeresen elsajátítottad (remélem)  az állandó karakterek (Consistent Characters) létrehozásának alapjait a portréktól kezdve egészen a NightCafe komplex rendszerekig. Fontos látni, hogy az állandó karaktertervezés nem merül ki a statikus profilképek vagy igazolványkép-szerű portrék gyártásában.A kiindulási alap (legyen az egy karaktermodell lap vagy egy jól sikerült fotó) csupán a DNS-e a figurádnak. Nem a póz vagy a kamera szöge a lényeg, hanem az egyedi azonosítók (Zoey esetében a vörös bob frizura, a szeplők és a zöld szem). Ha ezeket az AI rögzíti, a karaktered kiszabadul a merev beállításokból.🚀 Mit alkothatsz a megszerzett tudással?Az állandó karakter technológia birtokában a lehetőségeid szinte korlátlanok. Íme, mi mindent építhetsz Zoey (vagy bármely jövőbeli karaktered) köré:

    • 📖 Képregények és Graphic Novel-ek: Képes vagy teljes történeteket elmesélni, ahol a karaktered kockáról kockára, különböző érzelmekkel és interakciókkal jelenik meg.

    • 📱 Virtuális Influencer / Social Media Brand: Létrehozhatsz egy teljesen fiktív karaktert az Instagramra vagy TikTokra, aki "utazik", "posztol" a mindennapjairól, és márkákkal működik együtt.

    • 🎮 Játékfejlesztés és Concept Art: Saját videojáték- vagy könyvkaraktereket kelthetsz életre, bemutatva őket akció közben, harci pózokban vagy különböző kosztümökben.

    • 🎬 Storyboard és Filmtervezés: Rendezőként vagy íróként vizualizálhatod a forgatókönyved jeleneteit, pontosan ugyanazokkal a színészekkel (karakterekkel) minden beállításban.

    • 🛍️ Márkakabalák és Reklámfigurák: Cégek számára tervezhetsz olyan kabalafigurákat vagy állandó arcokat, amelyek minden marketingkampányban és plakáton azonosak maradnak.

    Gratulálok! Ezzel a tudással a kezedben már nemcsak magányos képeket generálsz, hanem komplett világokat és történeteket vagy képes építeni az AI segítségével.




    Két állandó karakter egy képen: 
    A text-to-image generálás mesterfoka


    A mesterséges intelligenciával történő képgenerálás (text-to-image) igen nagy  kihívása a karakterkonzisztencia (consistent characters) fenntartása. Míg egyetlen egyedi karakter létrehozása ma már egyszerű feladat, két teljesen különböző, fix karaktert egyidejűleg elhelyezni ugyanabban a jelenetben igazi technikai kihívás. Ez a tudás elengedhetetlen a vizuális történetmeséléshez, képregényekhez, könyvillusztrációkhoz vagy marketingkampányokhoz, ahol a szereplőknek jelenetről jelenetre felismerhetőnek kell maradniuk – anélkül, hogy a tulajdonságaik összemosódnának.

    A probléma: Miért keveri össze az MI a karaktereket?
    Amikor egy hagyományos promptban azt írjuk, hogy "egy barna hajú bőrdzsekis férfi és egy vörös hajú szeplős nő a kávézóban", a diffúziós modellek (mint a Stable Diffusion, Midjourney vagy DALL-E) hajlamosak az attribútum-szivárgásra (attribute bleed). Mivel a modell a prompt egészét egyben elemzi, a végeredmény gyakran egy ikerpár lesz, vagy a férfi kap szeplőket, esetleg a nőre kerül a bőrdzseki. A generatív MI alapértelmezetten nem tudja, melyik jelző melyik alanyhoz tartozik.A megoldás: A sikeres technika lépéseiA modern képgeneráló oldalakon (mint a NightCafe, Midjourney vagy Leonardo.ai) a megoldást a szigorúan strukturált, pozícióalapú promptszerkezet jelenti. A technika lényege, hogy az MI-t kényszerítjük a térbeli elválasztásra.

    1. A háromzónás prompt-architektúra
    A promptot három, jól elkülöníthető részre kell osztani:

    1. Globális kontextus és interakció: A kép elején tisztázni kell a környezetet, a kameraállást és a közös cselekvést (pl. Medium shot of two distinct people laughing in a cafe...).

    2. Karakter A (Pozicionálva): Az egyik irány kijelölése és a karakter szigorú leírása (pl. On the left, Leo, a tall man, short dark brown hair...).

    3. Karakter B (Pozicionálva): A másik irány kijelölése és a kontrasztos leírás (pl. On the right, Zoey, short ginger bob haircut, freckles...).

    2. A technika aranyszabályai a tökéletes eredményhez:

    • Horgonyszavak használata: A On the left (bal oldalon) és On the right (jobb oldalon) kifejezések koordinátákat adnak az MI-nek, így az adott zónába zárja a karakter tulajdonságait.

    • A többes számú jelzők tilalma: Soha ne használj olyan általánosító szavakat a prompt elején, mint a "Two beautiful young people" (Két gyönyörű fiatal ember). Ehelyett a "Two distinct people" (Két különböző ember) kifejezést használd, különben az arcvonásaik egyformává válnak.

    • Vizuális kontraszt: Minél eltérőbb a két karakter (hajszín, ruha, testalkat), annál könnyebben különíti el őket a generátor. Ha az egyiknek fekete kabátot adsz, a másiknak adj világos felsőt, hogy elkerüld a ruházat összemosódását.

    • Fejlett platform-funkciók: A modern eszközökben (pl. Midjourney --cref vagy a NightCafe @ karakterjelölése) a fenti strukturált promptot kombinálhatod előre elmentett referenciafotókkal is, ami szinte tökéletes arc-konzisztenciát biztosít.


    Példával illusztrálva: 

    Prompt Leo: "A 28-year-old Spanish man named Joe, tall, sharp jawline, short curly dark brown hair, brown eyes, wearing a black leather jacket." 

    Prompt Zoey: "a 25-year-old Hungarian girl, short ginger bob haircut, freckles on nose, bright green eyes"

    A közös prompt:  "A photorealistic medium shot of two people in a modern art gallery. On the left, Zoey, a 25-year-old Hungarian girl, short ginger bob haircut, freckles on nose, bright green eyes, wearing a white t-shirt. On the right, Leo, a 28-year-old Spanish man, short curly dark brown hair, brown eyes, wearing a black leather jacket. They are looking at a painting and talking, studio lighting"

    1. Jelenet: Munka / Együttműködés (Közeli interakció)
    Prompt:"Photorealistic medium close-up shot of two distinct people working together over a wooden table with blueprints. On the left, Zoey, a 25-year-old Hungarian girl, short ginger bob haircut, freckles on nose, bright green eyes, wearing a light blue button-up shirt. On the right, Leo, a 28-year-old Spanish man, short curly dark brown hair, brown eyes, wearing a dark gray hoodie. They are pointing at the table, focused expressions, natural office daylight.

    2. Jelenet: Éjszakai / Hangulatos (Kontrasztos megvilágítás)Itt a drámai fények (neon/utcai lámpák) segítenek abban, hogy a karakterek arcvonásai élesek és különállóak maradjanak.

    Prompt: "Cinematic night-time shot of two friends standing outside a neon-lit diner. On the left side of the frame, Zoey, a 25-year-old Hungarian girl, short ginger bob haircut, freckles, green eyes, wearing a leather jacket. On the right side of the frame, Leo, a 28-year-old Spanish man, short curly dark brown hair, brown eyes, wearing a denim jacket. Rain-slicked street, neon reflections, photorealistic, 8k resolution."

    3. Jelenet: Akció / Mozgás (Távolabbi, amerikai plán)
    Ez a beállítás azt teszteli, hogyan kezeli az AI a két különböző karaktert, amikor nem csak állnak, hanem aktív mozgásban vannak (séta közben).

    Prompt: "An American shot of two people walking side-by-side down a busy autumn street. Zoey is a 25-year-old Hungarian girl with a short ginger bob haircut, freckles on her nose, and bright green eyes, wearing a beige trench coat. Leo is a 28-year-old Spanish man with short curly dark brown hair and brown eyes, wearing a black woolen coat. They are laughing together, dynamic movement, blurred background of city life, photorealistic."

    4. jelenet: A puszta egymás mellett állás helyett közös cselekvést adtunk nekik a prompt legelején, de a részletes külső jegyeiket szigorúan megőriztük a bal és jobb oldali pozíciós zónákban, hogy a generator ne keverje össze őket.

    Prompt: "A medium shot of two distinct people having fun and laughing together inside a cozy modern coffee shop, sitting at a wooden table with coffee cups. **On the left**, Leo, a 28-year-old Spanish man, tall stature, sharp defined jawline, short curly dark brown hair, brown eyes, wearing a black leather jacket. **On the right**, Zoey, a 25-year-old Hungarian girl, short ginger bob haircut, prominent freckles on her nose, bright vivid green eyes, wearing a simple white t-shirt. Soft warm indoor lighting, depth of field, photorealistic, 8k resolution."


    Miért így működik?
    • "Having fun and laughing together": Ez a kifejezés azonnal beállítja a hangulatot és az arckifejezéseket (mosoly, nevetés) anélkül, hogy megváltoztatná az alapvető arcvonásaikat.

    • "Sitting at a wooden table with coffee cups": Ez a plusz részlet lefoglalja az MI kapacitását a környezet elemeivel (asztal, csészék), így kisebb az esélye annak, hogy a háttérből véletlenszerű, oda nem illő részleteket generáljon a karakterekre.

    • "Soft warm indoor lighting": A kávézókra jellemző lágy, meleg beltéri fények természetesebbé teszik a bőr tónusait (kiemelik Zoey szeplőit és Leo markáns állkapcsát).


    Út a professzionális vizuális történetmeséléshez


    Az állandó karakterek (consistent characters) használata vízválasztó a hobbi képgenerálás és a professzionális tartalomgyártás között, vagy a csúcsra röpíti a hobbi képgenerálót! Miközben egyetlen állandó karakter finomhangolása tökéletes alapot nyújt az egységes márkamegjelenítéshez, a profilképekhez vagy az egyéni portfóliókhoz, addig a két karakter egyidejű, konzisztens megjelenítése már a valódi történetmesélés (képregények, illusztrációk, storyboardok) kapuját nyitja meg.A megfelelő promptszerkezet, a térbeli pozicionálás és a modern MI-eszközök kombinálásával a technikai korlátok eltűnnek. A karakterek nemcsak felismerhetőek maradnak jelenetről jelenetre, hanem képesek lesznek valódi interakcióba lépni egymással – életre keltve a legbonyolultabb narratívákat is.


    Tovább: Advanced level 11