Článek
Průvodce světem promptů a digitální představivosti
Ačkoliv se na první pohled může zdát, že jde o pouhé zadávání příkazů, ve skutečnosti se jedná o novou formu komunikace, kde přesnost jazyka přímo určuje kvalitu výsledného díla. Pochopení mechanismů, které stojí za tvorbou vizuálního obsahu, nám umožňuje posunout se od náhodných pokusů k cílené tvorbě digitálního umění.
Definice promptu jako mostu mezi myšlenkou a kódem
V nejzákladnějším smyslu představuje prompt textové rozhraní, skrze které člověk předává své instrukce algoritmu. Není to jen příkaz, ale spíše kontextuální rámec, který umělé inteligenci říká, v jakém prostoru se má pohybovat. Když zadáváme prompt, nevybíráme hotový obrázek z databáze, ale aktivujeme neuronovou síť, aby na základě pravděpodobnosti a naučených vzorů vytvořila zcela novou kompozici. Prompt tedy funguje jako semínko, ze kterého vyroste obraz, přičemž každé zvolené slovo ovlivňuje genetickou informaci výsledného díla.

Ukázkový prompt jak je možné svoji identitu uložit do AI (na konci pod číslem 1)
Strategie pro budování efektivních obrazových instrukcí
Tvorba skutečně působivého obrázkového promptu vyžaduje více než jen pojmenování hlavního objektu. Efektivní instrukce by měla být vystavěna jako vrstvený popis, který začíná u konkrétního subjektu a postupuje k nuancím osvětlení, typu použitého objektivu a celkové atmosféře. Místo strohého konstatování je vhodné používat bohaté popisné výrazy, které definují texturu materiálů nebo směr dopadajícího světla. Klíčem k úspěchu je také určení uměleckého média, tedy zda má výsledek vypadat jako barokní olejomalba, surová reportážní fotografie na kinofilm nebo digitální render s vysokým dynamickým rozsahem. Právě tyto doplňující informace pomáhají algoritmu eliminovat miliardy nevhodných variant a soustředit se na konkrétní estetický směr.
Problém identity a proměnlivost lidské tváře
Častým zdrojem frustrace bývá situace, kdy do systému nahrajeme fotografii konkrétní osoby s cílem změnit její okolí či styl, ale výsledná tvář si není stoprocentně podobná. Tento jev je hluboce zakořeněn v tom, jak modely fungují. Umělá inteligence při procesu takzvané difuze obraz rozloží na digitální šum a následně jej znovu skládá. Během této rekonstrukce se snaží vyhovět textovému zadání, což nevyhnutelně vede ke konfliktu mezi rysy nahraného obličeje a estetickými parametry promptu. Pokud například žádáme o portrét ve stylu kyberpunku, model má tendenci upravovat anatomii obličeje tak, aby odpovídala vizuálním archetypům tohoto žánru, které má uloženy v paměti, čímž dochází k mírnému nebo i výraznému zkreslení identity původní osoby.

Často v rámci GDPR používám všude svůj obličej. Ale všechny prompty jsou univerzální. (Prompt 2)
Hranice slov aneb co v promptu nefunguje
Navzdory fascinujícímu pokroku existují oblasti, které jsou pro současnou umělou inteligenci pomocí pouhých slov téměř nedosažitelné. Jednou z největších bariér je přesná prostorová logika a interakce mezi objekty. Pokud v promptu požadujeme, aby jedna postava vykonávala velmi specifickou a fyzicky komplexní činnost s jiným předmětem, jako je například zavazování tkaniček nebo pletení copu, model často selhává v anatomické věrnosti. Stejně tak je problematické přesné počítání prvků; zadání konkrétního počtu prstů nebo přesného množství jablek v košíku končí často náhodným odhadem. Umělá inteligence totiž svět nechápe skrze fyzikální zákony nebo matematiku, ale skrze vizuální pravděpodobnost, což v těchto detailech naráží na své limity.

Existují prompty kde kreativita nezná hranice. (Prompt 3)
V dalším článku na téma prompty určitě přidám další na různou kreativitu. Proto vzniká mnoho stránek na sociálních sítích, kde se kreativci činní v tvorbě obrázků, tam, kde může být váš vlastní obličej.
Pár promtů na vyzkoušení
Stačí otevřít nástroj v ChatGPT nebo Gemini, tvorbu obrázků. Nahrát osobní fotografii (je to tím symbolem +), nejlépe jen obličej, nikoliv celou postavu. A zadat prompt a vytvoří se výsledný obrázek. Nemusí se povést hned na poprvé, u každého vytvořeného obrázku jde stisknout „vytvoř znovu“ a obrázek umělá inteligence vytvoří ještě jednou a jinak. Například poslední obrázek s vajíčkem, vznikl až na potřetí.
Prompt 1: Use my photo as a young man riding a massive tiger in a realistic mountain setting. The young man looks intense eyes. He’s shirtless under a rugged fur shoulder piece and leather armor with metal details, showing realistic skin texture, sweat, and subtle scars. His pants are made of dark worn leather, with boots splashed by icy water. A real steel sword and bow are strapped to his back.
The tiger is enormous yet believable, resembling a real Bengal tiger — thick striped fur, wet whiskers, visible muscles, and realistic eye reflections. It moves through a shallow stream in a snowy pine forest, water splashing around its paws. The man grips the reins firmly, his expression focused and determined, as if preparing for battle or a dangerous journey.
The background features a tall, cascading waterfall framed by pine trees and mist, with snow gently falling. The lighting is cinematic but natural — overcast daylight with cold tones, highlighting steam and breath vapor in the freezing air. Every element feels tangible and photographically detailed.
Prompt2: A full shot, captured at golden hour, of a young man standing to the right of a burning sofa in an open field. The man, dressed in a suit and tie, gazes off to the right with a contemplative expression. Intense orange and yellow flames engulf the sofa, sending a thick plume of dark grey smoke curling upwards against a pale blue, slightly overcast sky. The field consists of dry, golden-brown grass. The overall mood is dramatic and slightly surreal, with a shallow depth of field to keep the focus on the man and the fire." 100% use my upload reference image image generate
Prompt3: Ultra-realistic studio portrait based on the uploaded face. Transform the person into a surreal conceptual portrait where the top of the head is organically cracked open like an eggshell. The eggshell is NOT placed on the head.It is biologically fused with the skull, as if the bone itself transformed into an eggshell. The shell edges are embedded into the skin and bone: skin slightly stretched around the cracks, subtle redness and pressure around the edges, micro-fractures transitioning aturally from skin to shell. The cracked opening reveals a raw egg inside the head. A glossy golden yolk sits in the opening and slowly drips down the forehead and face. Egg white is semi-transparent and viscous, forming natural gravity-driven trails and droplets.Perfect material continuity: skin, bone, and eggshell blend seamlessly. No visible hard cut between materials. Hyper-realistic skin texture: pores, fine wrinkles, natural imperfections preserved. Liquid interacts with skin and glasses realistically (reflections, refractions, surface tension). Neutral, calm facial expression. Direct eye contact. Soft professional studio lighting. Dark neutral background (gray or blue-gray). Shallow depth of field. Photorealistic, cinematic, 8K detail. Surreal but believable. No blood, no gore, no horror.






