Knowledge base 3

Hogyan készül egy kép az AI segítségével - a PROMPT


A prompt a text-to-image (szövegből kép) rendszereknél egy olyan írásos leírás vagy utasítás, amely irányítja a mesterséges intelligenciát (MI) a kép létrehozásában. Ez a bemeneti adat határozza meg a készülő kép minden részletét, a központi témától kezdve a stíluson át egészen a megvilágításig. Ezzel magyarázod el a gépnek, hogy pontosan mit szeretnél látni.
Gyakorlatilag egy hidat képez az emberi elképzelés és a gép vizuális megvalósítása között.

Hogyan épül fel egy profi prompt?

Egy igazán jó kép nem a véletlen műve, hanem egy tudatosan felépített szerkezet eredménye. A hatékony prompt általában az alábbi elemekből áll:

  • A fő téma (Subject): Ki vagy mi van a képen? (pl. egy magányos asztronauta, egy neonfényes utca, egy aranyos kiscica).
  • Környezet és háttér (Setting): Hol történik az esemény? (pl. a Marson, egy esős tokiói sikátorban, egy virágos réten).
  • Művészeti stílus (Art Style): Milyen legyen a látványvilág? (pl. olajfestmény, fotorealisztikus, cyberpunk, anime, 3D render).
  • Megvilágítás és színek (Lighting & Color): Milyenek a fényviszonyok? (pl. naplemente, drámai árnyékok, pasztellszínek, neonfények).
  • Technikai paraméterek (Technical details): Milyen minőséget vársz? (pl. 8k felbontás, cinematic, nagy látószög, részletgazdag textúrák).

Az MI képgeneráló modellek a megadott szavak alapján próbálják értelmezni a felhasználó szándékát. Minél pontosabb és részletesebb a szöveg, annál közelebb lesz a végeredmény az eredeti ötlethez. Ezt a folyamatot, amikor valaki megtanulja a lehető leghatékonyabb utasításokat megfogalmazni, prompt engineeringnek - prompt-tervezésnek nevezzük.

Példa prompt:

Íme egy részletes prompt.  A prompt egységeit szögletes zárójelben jelöltem a könnyebb átláthatóság kedvéért:

[MŰFAJ ÉS STÍLUS:] Gazdagon texturált impresszionista olajfestmény, látható és dinamikus ecsetvonásokkal, vastagon felvitt festékrétegekkel (impasto technika).
[TÉMA:] Egy fiatal pár sétál kéz a kézben, hátulról látszódnak, amint egy kanyargós ösvényen haladnak beljebb az erdőbe.
[KÖRNYEZET:] Virágzó tavaszi erdő, ahol a fák ágain friss, üde zöld levelek és pasztellszínű vadon élő virágok (fehér szellőrózsák és lila ibolyák) láthatók.
[FÉNYEK ÉS SZÍNEK:] A fák lombjai között átszűrődő, táncoló napfény (chiaroscuro hatás), meleg arany fényfoltok a talajon. A paletta vibráló: smaragdzöld, azúrkék árnyékok, halványrózsaszín és napsárga reflexiók.
[HANGULAT ÉS MINŐSÉG:] Romantikus és békés atmoszféra, álomszerű elmosódottság, Claude Monet és Camille Pissarro stílusát idéző művészi kivitelezés, 8k felbontás, festői remekmű.


Miért így épül fel a prompt?
  • Stílus: Az "impresszionizmus" kulcsszó önmagában kevés; az ecsetvonások és az impasto említése segít abban, hogy a kép valódi festménynek tűnjön, ne digitális grafikának.
  • Fények: Az impresszionizmus lényege a fény játéka. Az "átszűrődő napfény" és a "színes árnyékok" adják meg a kép mélységét.
  • Kompozíció: A "hátulról látszódnak" instrukció segít abban, hogy a néző is részese legyen a sétának, és ne az arcok kidolgozottságán legyen a hangsúly, hanem az összhatáson.


Tovább olvasom