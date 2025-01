Reklama

V minulých dnech se možná i na vašem mobilu objevilo oznámení, že umělá inteligence Gemini od Googlu má novou funkci – umí generovat obrázky. Stačí napsat nebo vyslovit příkaz začínající slovy jako „vygeneruj“ nebo „vytvoř“ a pak už jen popíšete, o jaký obrázek máte zájem. Čím více detailů přidáte, tím lépe. Následně už se jen můžete těšit na výsledek.

Ale stojí to skutečně za to a může Gemini konkurovat takovým generátorům jako je Midjourney nebo třeba Leonardo.ai? Vyzkoušela jsem, jaké jsou její schopnosti a jak dobře dokáže porozumět promptům. A výsledek vás nejspíš překvapí.

Imagen 3 v Gemini

Gemini dosud uměla vyhledávat obrázky a zobrazovat je přímo v chatu. Teď Google její funkce vylepšil tím, že do ní vložil svůj AI generátor obrázků Imagen 3. O tom jsme vás informovali už v srpnu loňského roku, kdy ho Google představil a spustil v USA. Teď funguje přímo v Gemini, ale má jisté nedostatky.

Pozitivem je, že je zcela bez limitů a můžete generovat třeba jeden obrázek za druhým. Prompty lze zadávat v češtině, ale klidně i v angličtině. A to vše zcela zdarma a bez nutnosti hlídat si kredity, tokeny nebo cokoliv jiného.

Nevýhodou je, že Gemini neumí generovat lidi. Alespoň ne ve svých základních modelech. Pokud jí tedy dáte za úkol vytvořit obrázek ženy, dítěte či muže (nebo jakékoliv postavy obecně), po chvíli snažení vám zobrazí zprávu, že generování obrázků lidí je zatím přístupné pouze předběžném přístupu v Gemini Advanced. Tato verze už je ale placená. Takže volba je na vás.

Nedostatky v Gemini

A jak to Gemini jde? Stejně jako u ostatních generátorů obrázků (nebo u chatbotů obecně) platí, že čím vyšší je kvalita promptu, tím vyšší je kvalita výstupu. Občas ale Imagen 3 dělá nepříjemné chyby. Když jsem třeba chtěla obrázek chameleona s motorkou v pozadí, tak na motorku posadil jezdce, ale nějak mu zapomněl přidat nohy.

Nicméně, i velmi pokročilá Midjourney ještě nedávno nezvládala správně generovat ruce a nohy a tyto partie zkrátka AI generátorům dělají problémy. Na obranu Gemini ale musím říct, že pokud budete chtít lidi jen jako doplněk obrázku (nebudete se tedy snažit o portrét), Gemini to v klidu zvládne.

Také byste po ní neměli chtít přesné texty. Ty jí zkrátka nejdou a písmena si kombinuje zcela nahodile. Když jsem požadovala vygenerování balonku s nápisem SMILE, vznikl z toho nápis HUPD LIST. Těžko soudit, kde se vzal.

Výsledky mile překvapí

Celkově ale hodnotím výsledky jako velmi dobré. Pokud si vygenerovaný obrázek otevřete, můžete si ho následně stáhnout i do svého zařízení. Jeho velikost nebude nijak extrémní – ukládá se ve formátu JPEG a velikost je okolo 500 kB. Plakát na stěnu si z něj sice neuděláte, ale pro posílání, zveřejňování na sociálních sítích a tak dále je to plně dostačující.

Na výsledky mého snažení se můžete podívat výše v galerii. A sami posuďte, jak to Gemini zvládá. Přitom je pravděpodobné, že v budoucnu dostane různá vylepšení a půjde jí to lépe. Za mě je to až na drobné nedokonalosti docela dobrá práce.

Už jste vyzkoušeli generování obrázků v Gemini?

Zdroj: vlastní