Advanced level 11 - Saját kép beillesztése a text-to-image világba
Saját fotók beépítése a text-to-image világába az AI segítségével
Üdvözöllek a My Dream Canvas újabb oktatóanyagában! Miután megtanultuk a Consistent Characters (állandó karakterek)
létrehozását, most egy még izgalmasabb területre lépünk. Bemutatjuk,
hogyan alakíthatod át saját fotóidat (vagy bárki másét) lenyűgöző,
fotórealisztikus mesterséges intelligencia képekké.
Miért fantasztikus ez a technika a hobbi képkészítőknek? A saját fotók MI-vel való ötvözése (Image-to-Image és Image Prompting) az egyik legszórakoztatóbb és legsokoldalúbb funkció.
Időutazás és fantasy: Elrepítheti magát vagy barátait az ókori Rómába, egy cyberpunk jövőbe vagy egy varázslatos fantasy erdőbe.
Profi portrék minimális büdzsé ből: Nem kell drága fotózásra költenie; egy egyszerű otthoni szelfiből stúdióminőségű, üzleti vagy művészi portrét varázsolhat.
Személyre szabott ajándékok: Egyedi digitális festményeket, posztereket vagy avatárokat készíthet szeretteiről születésnapra, ünnepekre.
Kreatív önkifejezés: Újraértelmezheti a régi, unalmas fényképeit, új hangulatot, világítást és környezetet adva nekik.
Hogyan működik a technika? Mivel saját fotót biztonsági okokból nem töltök fel, a folyamatot professzionális minőségű, generált fotókkal mutatjuk be.
2. LÉPÉS: A 4 kép "összegyúrása" egyetlen végleges képpé. Most következik a varázslat, ahol a 4 képet egyszerre használjuk fel. Nyissunk egy új generálást a NightCafe-n.
Hogyan adjuk meg a képeket a NightCafe felületén?
A NightCafe Advanced (Haladó) módjában az Image Prompts szekcióban nemcsak egy, hanem több képet is hozzáadhatunk a generáláshoz.
Kattints az Add Image gombra, és töltsd fel az 1. képet.Kattints újra az Add Image gombra, és töltsd fel a 2. képet. Ismételd meg ezt a 3. és 4. képpel. Most ott látod mind a 4 fotót egymás mellett. Az MI mind a négyet elemezni fogja!
Mind a 4 kép alatt találsz egy csúszkát. Mivel azt akarjuk, hogy az MI mind a 4 képből egyenlő arányban vegyen át információkat (az egyikből a szemet, a másikból a profilvonalat, a harmadikból a textúrát), állítsuk mind a négy kép súlyát 0.15 és 0.20 közé. (Összesen a képsúlyok ne lépjék túl a 0.65-0.70-et, hogy maradjon hely az új környezetnek is!).
3. LÉPÉS: A Végleges Környezet Prompt megadásaMiután a 4 képből az MI összeállította a hölgy arcának 3D-s karakterisztikáját a memóriájában, a szöveges prompttal megmondjuk neki, hová tegye őt.
- Végleges Transzformációs Prompt:
A photorealistic cinematic portrait of the 65-year-old grey-haired woman combined from the source images, transformed into a wise fantasy healer, wearing ancient emerald green robes with silver embroidery, standing in a magical mystical forest surrounded by glowing plants and fireflies, ethereal lighting, 8k resolution, hyper-detailed.
Az eredmény: Az MI a 4 képből összeollózza és megalkotja a hölgy arcát – ami így sokkal pontosabb és élethűbb lesz, mintha csak egyetlen fotót kapott volna –, majd ráadja a zöld köpenyt, és behelyezi a szentjánosbogaras varázserdőbe.Miért hoz ez a módszer 100%-os eredményt?

Több információ az MI-nek: Ha csak egy képet adsz meg, az MI nem tudja, hogyan néz ki a karaktered oldlról vagy nevetés közben. 4 képből már pontosan érti az arc formáját.
Eltűnnek a torzulások: Ha az egyik alapfotón picit hibás volt a fül vagy a haj, a másik három kép korrigálja azt a végleges generálásnál.
Profi hobbi technika: Ez a legközelebbi módszer a profi stúdiók által használt modell-tanításhoz, de teljesen ingyen, bonyolult kódolás nélkül elérhető a NightCafe-n.
Hogyan érheted el a 100%-os eredményt?
Egyszerű ruházat az alapképeken: Az alapfotókon a modell mindig sima, egyszínű (például fehér) pólót viseljen. Ezt az MI sokkal könnyebben cseréli le nehéz bársonyruhákra vagy sci-fi páncélokra.
Egyszínű háttér fontossága: A szilárd szürke stúdióháttér segít az MI-nek abban, hogy tisztán az arcra fókuszáljon, és ne keverje össze a forrásképek hátterét az új fantasy erdővel.
A Face Enhance használata: Miután a NightCafe elkészítette a végleges képet, mindig kattints a Face Enhance (Arcjavítás) gombra. Ez az algoritmus külön újrarendereli a szemeket, a fogakat és a bőrt, törölve a digitális elmosódottságot.
Új jelenet – A hölgy mint óvónéni egy óvodában
Miután
az előző lépésben a 4 alapfotó segítségével az MI rögzítette a 65 éves,
ősz hajú hölgy arcvonásait a memóriájában, bármilyen földi vagy
mesebeli környezetbe áthelyezhetjük őt. Most nézzük meg, hogyan
varázsolhatunk belőle egy kedves óvónénit.
1. Lépés: A beállítások ellenőrzése
A NightCafe Advanced módjában a 4 alapfotó továbbra is be van töltve az Image Prompts szekcióban, és a súlyuk változatlanul 0.15-re van állítva képenként.
2. Lépés: Az új környezet megadása (Másolható prompt)
Cseréld le a fő szövegmezőben a fantasy promptot az alábbi angol nyelvű leírásra:
A photorealistic warm cinematic portrait of the 65-year-old grey-haired woman from the source images, transformed into a kind kindergarten teacher. She is wearing a colorful patterned cardigan over a soft yellow blouse, smiling warmly at the children. She is standing inside a brightly lit, cheerful kindergarten classroom with colorful drawings on the walls, wooden toys, and small chairs in the background. Soft natural sunlight filtering through the windows, high-detailed skin texture, friendly atmosphere, 8k.
Mi történik a generálás során?Az MI fogja a forrásképekről megtanult kedves kék szemeket és a hölgy karakteres arcát, de a korábbi fehér pólót egy barátságos, színes mintás kardigánra cseréli. A szürke stúdióháttér helyett pedig egy napfényes, vidám óvodai csoportszoba jelenik meg a háttérben, tele színes rajzokkal és fajátékokkal.
Miért fontos ez a példa a hobbi képkészítőknek?
Ez
a példa megmutatja a dizájnereknek és a hobbi alkotóknak, hogy a
karakter-konzisztencia (az állandó arc) megtartása mellett a hangulatot
is 100%-ban kontrollálni tudjuk. A hölgy arcán lévő ráncok már nem egy
"bölcs varázsló" misztikumát sugározzák, hanem egy tapasztalt,
szeretetreméltó óvónéni megnyugtató kedvességét – mindezt pusztán a
környezet és a ruházat szavainak megváltoztatásával.
4. FÁZIS: Új jelenet – A hölgy mint sivatagi régésznő egy fáraó sírjában
Ez a példa tökéletesen bemutatja, hogyan képes az MI drámai filmbe illő világítást (Cinematic Lighting) és kalandfilmes hangulatot teremteni, miközben a hölgy arca teljesen felismerhető marad.
1. Lépés: Beállítások a NightCafe felületénA 4 alapfotó továbbra is a helyén marad az Image Prompts résznél, egyenként 0.15-ös súllyal.
2. Lépés: A kalandor prompt megadása (Másolható szöveg)Másold be a fő szövegmezőbe az alábbi leírást:
A photorealistic epic cinematic portrait of the 65-year-old grey-haired woman from the source images, transformed into a brave archaeologist. She is wearing a rugged khaki safari shirt and a classic leather adventurer hat, a leather satchel over her shoulder. She is standing inside an ancient Egyptian tomb, holding a glowing lantern that illuminates detailed hieroglyphs on the sandstone walls. Golden torchlight reflection in her kind blue eyes, dusty atmospheric air with sunbeams, high-detailed 8k resolution.
Az eredmény:Az MI a hölgy megszokott arcvonásait egy határozott, kalandvágyó arckifejezéssel ötvözi. A szürke pólót lecseréli a szafari ingre és a stílusos kalapra, a hátteret pedig egy rejtélyes, fáklyafénnyel megvilágított egyiptomi sírkamrává alakítja, ahol a porszemek szinte táncolnak a levegőben.

Mi történik a generálás során? Az
MI fogja a forrásképekről megtanult kedves kék szemeket és a hölgy
karakteres arcát, de a korábbi fehér pólót egy barátságos, színes mintás
kardigánra cseréli. A szürke stúdióháttér helyett pedig egy napfényes,
vidám óvodai csoportszoba jelenik meg a háttérben, tele színes rajzokkal
és fajátékokkal.
Az eredmény: Az MI a hölgy megszokott arcvonásait egy határozott, kalandvágyó arckifejezéssel ötvözi. A szürke pólót lecseréli a szafari ingre és a stílusos kalapra, a hátteret pedig egy rejtélyes, fáklyafénnyel megvilágított egyiptomi sírkamrává alakítja, ahol a porszemek szinte táncolnak a levegőben.
ÖSSZEFOGLALÓ: A 100%-os karakter-azonosság receptje
Hogy azonnal el tudj indulni, íme a NightCafe beállítások puskája, amit bármikor használhatsz:
Beállítás neve/ Mit kell megadni / Beállítani?/ Miért fontos?
Alapmodell Flux vagy SDXL Ezek a modellek kezelik legszebben az emberi bőrt és a fotórealizmust.
Forrásképek száma 4 különböző fotó (Szemből, profilból, közelről, nevetve) Ebből tanulja meg az MI az arc 3D-s szerkezetét.
Image Weight (Súly) Képenként pontosan 0.15 Így a 4 kép együttesen 0.60-as erőt ad, ami megtartja az arcot, de engedi az új hátteret.
Fix Seed (Mag) Az 1. kép Seed számát másold a többi alapfotóhoz Ez garantálja, hogy az alapfotókon ugyanaz a személy szerepeljen.
Face Enhance BEKAPCSOLVA (a generálás után) Eltünteti a digitális torzulásokat a szemek és a fogak környékéről.
Negatív Prompt cartoon, anime, 3d render, blurry, deformed face, drawing, painting Megakadályozza, hogy az MI elrontsa a fotórealisztikus hatást.
Teljes alakos (Full-Body) kép készítése az állandó arccal
5. FÁZIS: Szintugrás – Teljes alakos (Full-Body) kép készítése az állandó arccal
Amikor
egy meglévő portréról váltunk teljes alakos képre, az MI-nek meg kell
mondanunk, hogyan nézzen ki a karakter többi része (alkata,
testmagassága, testtartása), miközben a 4 forrásfotóból továbbra is
behúzza az arcot
1. Lépés: A NightCafe beállításai
- A 4 db portré alapfotó továbbra is maradjon betöltve az Image Prompts szekcióban.
- A képsúlyokat (Image Weight) most állítsuk picit magasabbra, egyenként 0.18-ra (összesen kb. 0.72), mert a távoli kamera miatt az MI-nek erősebb "emlékeztetőre" van szüksége, hogy ne felejtse el az arcot.
2. Lépés: A Teljes Alakos Prompt és a Kamera-szavakA trükk a megfelelő fotós kifejezések használata. Olyan szavakat kell beírnunk, mint a full-body shot (teljes alakos kép) vagy wide shot (nagylátószögű kép), és részletesen le kell írnunk a ruházatot és a cipőt is, hogy az MI tudja, lefelé is kell rajzolnia. Tegyük a hölgyet egy elegáns környezetbe: legyen egy sikeres, stílusos üzletasszony egy modern galériában vagy irodában.
Másolható Teljes Alakos Prompt:
A photorealistic crisp full-body shot of the 65-year-old grey-haired woman from the source images. She is standing confidently, posing from head to toe, wearing an elegant tailored navy blue pantsuit with a silk cream blouse and classic black high heels. She is holding a tablet in her hand. The background is a modern, sunlit art gallery with minimalist paintings and concrete floors. Shot on a wide 35mm lens, depth of field, professional corporate photography, hyper-detailed, 8k resolution.

A 100%-os eredmény titka teljes alakos képeknél: Az "Inpainting" trükkHa
lefuttatod a fenti promptot, a kompozíció (a ruha, a háttér, az alak)
tökéletes lesz, de ha ránézel a hölgy arcára, látni fogod, hogy a
távolság miatt a szemei vagy a száj picit elmosódottabbak, mint a
korábbi közeli portrékon.
- Miután elkészült a teljes alakos kép, ne csak a sima Face Enhance gombra kattints!
- Válaszd az Inpaint (Képjavítás/Maszkolás) funkciót.
- Az egérrel vagy a telefonod ujjaddal színezd (maszkold) be kizáriglag a hölgy arcát a teljes alakos képen.
- A módosító promptba írd be újra a legelső alap-promptunkat: "The photorealistic face of the 65-year-old woman with short grey hair and kind blue eyes, high detailed skin texture".
- Futtasd le a javítást!
Mi történik ekkor? Az MI a kép többi részét (a szép ruhát, a testet, a hátteret) érintetlenül hagyja, de az arc területét újrarendereli szuper-közeli felbontásban, beillesztve a 4 forrásfotónk tűéles részleteit.Ezzel a módszerrel a hobbi képkészítők előtt megnyílik a teljes szabadság: a karakterük már nemcsak egy helyben ülő portréalkany, hanem egy mozgásban lévő, egész alakos szereplővé válik!
6. FÁZIS: Bónusz jelenet – Teljes alakos divatfotózás Párizs utcáin. Hogy az olvasók lássák, mennyire dinamikusan változtatható a teljes alakos technika is, küldjük el a hölgyet egy stílusos utazásra. Ebben a jelenetben az MI-nek egy gyönyörű, mélységélességgel (elmosott háttérrel) rendelkező utcai fotót kell készítenie, ahol a hölgy tetőtől talpig divatosan van felöltözve.Alkalmazott Prompt a párizsi fotózáshoz:
A photorealistic full-body fashion photography shot of the 65-year-old grey-haired woman from the source images. She is walking elegantly on a cobblestone street in Paris, posing head-to-toe. She is wearing a chic beige trench coat, a stylish red silk scarf wrapped around her neck, dark slim jeans, and elegant leather ankle boots. In the background, the Eiffel Tower is softly blurred in the autumn mist. Beautiful natural overcast lighting, professional magazine style, shot on 50mm lens, highly detailed textures, 8k.
A generálás után itt is alkalmazd a fenti Inpainting (Maszkolási) technikát a hölgy arcán, hogy a távoli fotón is tökéletesen kirajzolódjanak a kedves kék szemek és az egyedi vonások.

Ezzel a módszerrel a hobbi képkészítők előtt megnyílik a teljes szabadság: a karakterük már nemcsak egy helyben ülő portréalkany, hanem egy mozgásban lévő, egész alakos szereplővé válik a világ bármely pontján!
Természetesen végigvittem a saját képemmel a leírtakat és különböző, izgalmas helyekre tettem be a képemet! Ha már személyesen nem láthatom a világ sok csodáját, legalább legyen közös képem velük, és ellátogattunk a jövőbe is! Izgalmas út, javaslom járjátok be Ti is!
