Knowledge base 3
Hogyan készül egy kép az AI segítségével - a PROMPT
A prompt a
text-to-image (szövegből kép) rendszereknél egy olyan írásos leírás
vagy utasítás, amely irányítja a mesterséges intelligenciát (MI) a kép
létrehozásában. Ez a bemeneti adat határozza meg a készülő kép minden
részletét, a központi témától kezdve a stíluson át egészen a
megvilágításig. Ezzel magyarázod el a gépnek, hogy pontosan mit
szeretnél látni.
Gyakorlatilag egy hidat képez az emberi elképzelés és a gép vizuális megvalósítása között.
Hogyan épül fel egy profi prompt?
Egy igazán jó kép nem a véletlen műve, hanem egy tudatosan felépített szerkezet eredménye. A hatékony prompt általában az alábbi elemekből áll:
- A fő téma (Subject): Ki vagy mi van a képen? (pl. egy magányos asztronauta, egy neonfényes utca, egy aranyos kiscica).
- Környezet és háttér (Setting): Hol történik az esemény? (pl. a Marson, egy esős tokiói sikátorban, egy virágos réten).
- Művészeti stílus (Art Style): Milyen legyen a látványvilág? (pl. olajfestmény, fotorealisztikus, cyberpunk, anime, 3D render).
- Megvilágítás és színek (Lighting & Color): Milyenek a fényviszonyok? (pl. naplemente, drámai árnyékok, pasztellszínek, neonfények).
- Technikai paraméterek (Technical details): Milyen minőséget vársz? (pl. 8k felbontás, cinematic, nagy látószög, részletgazdag textúrák).
Az MI képgeneráló modellek a megadott szavak alapján próbálják értelmezni a felhasználó szándékát. Minél pontosabb és részletesebb a szöveg, annál közelebb lesz a végeredmény az eredeti ötlethez. Ezt a folyamatot, amikor valaki megtanulja a lehető leghatékonyabb utasításokat megfogalmazni, prompt engineeringnek - prompt-tervezésnek nevezzük.
Példa prompt:
Íme
egy részletes prompt. A prompt egységeit
szögletes zárójelben jelöltem a könnyebb átláthatóság kedvéért:
[MŰFAJ ÉS STÍLUS:] Gazdagon
texturált impresszionista olajfestmény, látható és dinamikus ecsetvonásokkal,
vastagon felvitt festékrétegekkel (impasto technika).
[TÉMA:] Egy fiatal pár sétál kéz
a kézben, hátulról látszódnak, amint egy kanyargós ösvényen haladnak beljebb az
erdőbe.
[KÖRNYEZET:] Virágzó tavaszi
erdő, ahol a fák ágain friss, üde zöld levelek és pasztellszínű vadon élő
virágok (fehér szellőrózsák és lila ibolyák) láthatók.
[FÉNYEK ÉS SZÍNEK:] A fák
lombjai között átszűrődő, táncoló napfény (chiaroscuro hatás), meleg arany
fényfoltok a talajon. A paletta vibráló: smaragdzöld, azúrkék árnyékok,
halványrózsaszín és napsárga reflexiók.
[HANGULAT ÉS MINŐSÉG:]
Romantikus és békés atmoszféra, álomszerű elmosódottság, Claude Monet és
Camille Pissarro stílusát idéző művészi kivitelezés, 8k felbontás, festői
remekmű.
- Stílus: Az "impresszionizmus" kulcsszó önmagában kevés; az ecsetvonások és az impasto említése segít abban, hogy a kép valódi festménynek tűnjön, ne digitális grafikának.
- Fények: Az impresszionizmus lényege a fény játéka. Az "átszűrődő napfény" és a "színes árnyékok" adják meg a kép mélységét.
- Kompozíció: A "hátulról látszódnak" instrukció segít abban, hogy a néző is részese legyen a sétának, és ne az arcok kidolgozottságán legyen a hangsúly, hanem az összhatáson.
Tovább olvasom
