Knowledge base 3
Hogyan készül egy kép az AI segítségével - a PROMPT
Summary
A prompt (melyet mindig angolul írunk meg!) egy részletes leírás, amely híd az emberi képzelet és a gépi
megvalósítás között, irányítva a mesterséges intelligencia (MI)
képalkotási folyamatát. A hatékony promptok tudatos szerkezetre épülnek,
amely a téma, környezet, stílus, fények és technikai paraméterek pontos
meghatározásával teszi lehetővé a látványos eredményt.
Miért "gondolkodik" angolul az AI? Miért írjuk a promptokat angolul?
A
legtöbb nagy nyelvi modellt (mint a GPT-4 vagy a Midjourney) elsősorban
angol nyelvű adatokon tanították. Bár értik a magyart, az összetett
logikai összefüggéseket és a finom részleteket az angol nyelvű promptok alapján hajtják végre a legnagyobb pontossággal. Léteznek ugyan kiváló magyar fejlesztésű AI felületek
is, amelyek kifejezetten a hazai felhasználók munkáját segítik. Ezek
remekül használhatók napi feladatok automatizálására, de általában 1-3
specifikus generátorral (például szövegíróval vagy képgenerálóval)
dolgoznak, így a lehetőségek szűkebbek.A My Dream Canvas
oldalon azért használok magyar nyelvű promptokat, hogy mindenki
számára érthetővé és könnyen tanulhatóvá tegyem az alkotás folyamatát.
Ha azonban saját magad szeretnél profi, angol nyelvű utasításokat
összeállítani, érdemes megnyitni a háttérben egy gyors fordítóoldalt.
Ajánlott fordítóoldalak a promptíráshoz:
- DeepL Translator – Jelenleg a legpontosabb, legtermészetesebb fordító AI alapokon.
- Google Fordító – Gyors, egyszerű, és közvetlenül a böngészőből elérhető.
- Reverso Context – Kiváló, ha egy-egy kifejezés pontos szakmai megfelelőjét keresed.
Tippek a magyar ötletek angolra fordításához.
Ahhoz,
hogy az AI pontosan azt a képet vagy szöveget hozza létre, amit
megálmodtál, érdemes a fordítás során az alábbi egyszerű szabályokat
követni:
Használj egyszerű tőmondatokat: A bonyolult, többszörösen összetett magyar mondatokat a fordítók néha félreértik. Fogalmazz lényegre törően (pl. "Egy macska ül a tetőn, naplemente van" ahelyett, hogy "Azt szeretném, hogy egy macska legyen a képen, amint éppen a ház tetején pihen, miközben lemegy a nap").
Használj jelzőket: Ahelyett, hogy csak annyit írnál, hogy "autó", írd oda, hogy "régi, piros, rozsdás autó". Az angol fordító így pontosabb kifejezéseket (pl. vintage, rusty) fog ajánlani, amit az AI jobban ért.
Keresőszavak (Keywords) használata: Ha képet generálsz, ne csak teljes mondatokat fordíts. Egyszerűen írd be a magyar kulcsszavakat vesszővel elválasztva a fordítóba (pl. "filmszerű világítás, 8k felbontás, hiperrealisztikus"), és a kapott angol listát másold a promptba.
Ellenőrizd a visszafordítást: Ha nem vagy biztos az angol szövegben, másold vissza a fordítóba (angolról magyarra). Ha a magyar eredmény még mindig azt jelenti, amit szerettél volna, akkor a promptod készen áll!
Pro tipp: A DeepL használatakor kattints a lefordított szavakra – a program ilyenkor alternatív kifejezéseket is felajánl, amikkel még pontosabban finomhangolhatod az alkotásodat.
A PROMT
A prompt a
text-to-image (szövegből kép) rendszereknél egy olyan írásos leírás
vagy utasítás, amely irányítja a mesterséges intelligenciát (MI) a kép
létrehozásában. Ez a bemeneti adat határozza meg a készülő kép minden
részletét, a központi témától kezdve a stíluson át egészen a
megvilágításig. Ezzel magyarázod el a gépnek, hogy pontosan mit
szeretnél látni.
Gyakorlatilag egy hidat képez az emberi elképzelés és a gép vizuális megvalósítása között.
Hogyan épül fel egy profi prompt?
Egy igazán jó kép nem a véletlen műve, hanem egy tudatosan felépített szerkezet eredménye. A hatékony prompt általában az alábbi elemekből áll:
A fő téma (Subject): Ki vagy mi van a képen? (pl. egy magányos asztronauta, egy neonfényes utca, egy aranyos kiscica).
Környezet és háttér (Setting): Hol történik az esemény? (pl. a Marson, egy esős tokiói sikátorban, egy virágos réten).
Művészeti stílus (Art Style): Milyen legyen a látványvilág? (pl. olajfestmény, fotorealisztikus, cyberpunk, anime, 3D render).
Megvilágítás és színek (Lighting & Color): Milyenek a fényviszonyok? (pl. naplemente, drámai árnyékok, pasztellszínek, neonfények).
Technikai paraméterek (Technical details): Milyen minőséget vársz? (pl. 8k felbontás, cinematic, nagy látószög, részletgazdag textúrák).
Az MI képgeneráló modellek a megadott szavak alapján próbálják értelmezni a felhasználó szándékát. Minél pontosabb és részletesebb a szöveg, annál közelebb lesz a végeredmény az eredeti ötlethez. Ezt a folyamatot, amikor valaki megtanulja a lehető leghatékonyabb utasításokat megfogalmazni, prompt engineeringnek - prompt-tervezésnek nevezzük.
Példa prompt:
Íme
egy részletes prompt. A prompt egységeit
szögletes zárójelben jelöltem a könnyebb átláthatóság kedvéért:
[MŰFAJ ÉS STÍLUS:] Gazdagon
texturált impresszionista olajfestmény, látható és dinamikus ecsetvonásokkal,
vastagon felvitt festékrétegekkel (impasto technika).
[TÉMA:] Egy fiatal pár sétál kéz
a kézben, hátulról látszódnak, amint egy kanyargós ösvényen haladnak beljebb az
erdőbe.
[KÖRNYEZET:] Virágzó tavaszi
erdő, ahol a fák ágain friss, üde zöld levelek és pasztellszínű vadon élő
virágok (fehér szellőrózsák és lila ibolyák) láthatók.
[FÉNYEK ÉS SZÍNEK:] A fák
lombjai között átszűrődő, táncoló napfény (chiaroscuro hatás), meleg arany
fényfoltok a talajon. A paletta vibráló: smaragdzöld, azúrkék árnyékok,
halványrózsaszín és napsárga reflexiók.
[HANGULAT ÉS MINŐSÉG:]
Romantikus és békés atmoszféra, álomszerű elmosódottság, Claude Monet és
Camille Pissarro stílusát idéző művészi kivitelezés, 8k felbontás, festői
remekmű.
Stílus: Az "impresszionizmus" kulcsszó önmagában kevés; az ecsetvonások és az impasto említése segít abban, hogy a kép valódi festménynek tűnjön, ne digitális grafikának.
- Fények: Az impresszionizmus lényege a fény játéka. Az "átszűrődő napfény" és a "színes árnyékok" adják meg a kép mélységét.
Kompozíció: A "hátulról látszódnak" instrukció segít abban, hogy a néző is részese legyen a sétának, és ne az arcok kidolgozottságán legyen a hangsúly, hanem az összhatáson.

