Je založen na jazykovém modelu GPT-3, který dokáže generovat souvislý a plynulý text na různá témata. DALL-E rozšiřuje GPT-3 přidáním komponenty vidění, která dokáže kódovat i dekódovat obrázky. To umožňuje DALL-E porozumět textu i obrázkům a vytvářet jejich neotřelé kombinace.
Tento článek prozkoumá některé z nejzajímavějších a nejkreativnějších textových výzev, které DALL-E dokáže zpracovat, a ukáže vám některé příklady obrázků, které vytváří.
Jak používat textové výzvy s DALL-E?
DALL-E kombinuje GPT-3, výkonný jazykový model, a CLIP, model vidění, který se lze naučit z přirozeného jazyka. DALL-E dokáže vytvářet přirozené a nápadité obrázky v závislosti na libovolném zadávání textu. OpenAI to vyžaduje zaregistrovat se a přihlásit k použití DALL-E 2. Pro tento účel se můžete dozvědět více o procesu registrace a přihlášení odkazem na tento článek “ Jak se zaregistrovat a přihlásit k DALL-E 2? “:
Chcete-li používat textové výzvy s DALL-E, musíte provést několik základních kroků:
1. Napište každý malý prvek do textové výzvy
DALL-E dokáže zpracovat složité a abstraktní textové výzvy, jako jsou metafory, analogie, kompozice, transformace a omezení. Uživatelé mohou využívat přirozený jazyk, klíčová slova nebo kombinaci obojího.
Příklad
DALL-E umí generovat obrázky na základě textových výzev. Tyto textové výzvy vyžadují, aby DALL-E koherentně a realisticky kombinoval různé koncepty, tvary, barvy, textury a materiály. Použijte například textovou výzvu „ pětiúhelník ze sýra, který hoří ' jak je uvedeno níže:
2. Upřesněte styl
Další funkcí DALL-E je jeho schopnost generovat více obrázků pro stejnou textovou výzvu, každý s jinou interpretací nebo stylem.
Příklad
DALL-E může generovat obrázky „ kočka v obleku “, které se liší typem obleku, pózou kočky, pozadím a výrazem obličeje. To ukazuje, že DALL-E má bohatou a rozmanitou představivost a dokáže vytvářet obrázky, které jsou nejen přesné, ale také překvapivé a vtipné:
3. Relevantní pro konkrétní domény nebo kontexty
DALL-E může také generovat obrázky, které jsou relevantní pro konkrétní domény nebo kontexty, jako je umění, historie, kultura, věda nebo fikce.
Příklad
DALL-E může generovat obrázky „ obraz ženy se dvěma očima od Picassa “. Textová výzva vyžaduje, aby DALL-E měl určité znalosti nebo obeznámenost s doménou nebo kontextem a aby generoval obrázky, které jsou konzistentní a vhodné:
4. Nezapomeňte napsat o barvách
Do textové výzvy můžete přidat modifikátory, které určí styl, barvu, perspektivu nebo rozvržení obrázku.
Příklad
Příklad je zvažován zadáním textové výzvy „ modrý dům s červenou střechou ve stylu Van Gogha “, jak je vidět na obrázku níže:
Bonusový tip: Jak upřesnit textové výzvy a Upravit obrázky?
Volitelně mohou uživatelé upřesnit textové výzvy nebo upravit obrázky pomocí některých nástrojů poskytovaných DALL-E.
Příklad
Můžete stisknout pravé tlačítko myši na obrázku a stisknout „ Upravit obrázek ” možnost změnit barvu nebo tvar objektu na obrázku:
Uživatelé mohou také využít „ Zvětšení ” nástroj pro přiblížení nebo oddálení konkrétní části obrázku, jak je uvedeno níže:
To vše je o různém použití textových výzev s DALL-E.
Závěr
Chcete-li používat textové výzvy s DALL-E, musí uživatelé napsat každý malý prvek do textové výzvy a specifikovat styl, domény, kontexty a barvy. DALL-E je úžasný nástroj, který vám může pomoci vytvořit úžasné a originální obrázky z textových výzev. Je to také zábavný způsob, jak prozkoumat svou představivost a zjistit, s čím může DALL-E přijít. Mějte však na paměti, že DALL-E není dokonalý a může někdy generovat obrázky, které jsou nevhodné, nesmyslné nebo nepřesné. Vždy používejte DALL-E zodpovědně a s respektem.