TOPlist

Google právě ukázal Gemini Omni! Tvoří videa, která vám vyrazí dech

  • Google na konferenci I/O 2026 představil nový generativní model Gemini Omni zaměřený zatím na tvorbu videa
  • Model přijímá libovolnou kombinaci vstupů – text, obrázek, video i zvukovou stopu – a vytvoří z nich jediný výsledný klip
  • Varianta Omni Flash je dostupná již dnes pro předplatitele Google AI Plus a vyšší, na YouTube Shorts pak zdarma

Sdílejte:
Jakub Kárník
Jakub Kárník
20.5.2026 12:00
Ikona komentáře 2
gemini omni jpg

Loni v září Google ukázal model Nano Banana, který se rychle stal jedním z nejpoužívanějších nástrojů pro úpravu fotografií pomocí umělé inteligence. Lidé s ním obnovovali staré rodinné snímky, převáděli skici na fotorealistické obrázky nebo vizualizovali designové nápady. Letos Google posouvá stejný princip o úroveň výš – přichází Gemini Omni, model schopný stejnou logiku aplikovat na video.

Omni je nová rodina generativních modelů od Googlu, kterou firma představila na konferenci Google I/O 2026. První zástupce – Gemini Omni Flash – se od dnešního dne začíná postupně zpřístupňovat uživatelům aplikace Gemini, platformy Google Flow a také tvůrcům na YouTube Shorts. Druhý a výkonnější model označený Omni Pro Google zatím jen zmínil, detaily uvolní postupně.

Editace videa konverzací, ne posuvníky

Hlavní novinkou Omni není ani tak samotné generování videa – to umí konkurenční modely typu OpenAI Sora, Runway nebo Meta Movie Gen už delší dobu. Důraz Google klade na konverzační úpravu. Uživatel zadá videoklip a běžnou řečí popisuje, co se s ním má stát: změnit prostředí, přidat postavu, upravit pohyb kamery. Každá další instrukce navazuje na předchozí, scéna si pamatuje kontext a postavy zůstávají vizuálně konzistentní.

Ve zveřejněných ukázkách například zadání „udělej tu sochu z bublin“ promění mramorovou plastiku v plovoucí strukturu z mýdlových bublin, a to bez nutnosti cokoliv ručně maskovat. Jiná ukázka pak po dotyku ruky promění zrcadlo v pohyblivou tekutinu a paži postavy v reflexní materiál. Veškerou tuto práci dříve obstarávali specialisté ve studiích, často s rozpočty v řádech tisíců dolarů za jediný záběr.

Fyzika, znalosti a vizuální vysvětlovače

Google při představení Omni opakovaně zdůrazňoval, že model nestaví scény jen vizuálně přesvědčivě, ale chápe i to, jak by se měly chovat. Modelu byly vylepšeny schopnosti práce s gravitací, kinetickou energií i dynamikou kapalin. V jedné z ukázek se kulička valí po zalomené dráze ve stylu řetězové reakce – pohyb i zvukové efekty každého odrazu odpovídají skutečnosti.

Druhým pilířem je propojení s tím, co Gemini „ví“ o světě. Omni dokáže vyrobit krátký vizuální vysvětlovač komplexní problematiky – jednou z prezentovaných ukázek je stop-motion animace ve stylu claymation, která vysvětluje proces sbalování bílkovin (protein folding). Z krátkého textového zadání tak může vzniknout obsah, jehož ruční výroba by zabrala dny.

Tento přístup navazuje na dlouhodobou snahu Googlu vybudovat tzv. world model – model, který chápe svět jako koherentní celek, ne jako sled náhodných pixelů. Stejnou filozofii firma uplatňuje i u experimentálního modelu Genie, který generuje interaktivní herní prostředí. Genie nicméně zůstává dostupný pouze předplatitelům nejvyššího tarifu AI Ultra.

Vlastní avatar a opatrnost s hlasem

Omni umí do videí vložit i digitálního dvojníka uživatele. Funkce Avatar vytvoří podle zadaných vzorků digitální verzi člověka, která ve výsledných videích mluví jeho hlasem. Podobnou cestou se loni vydal OpenAI ve své – mezitím už zrušené – samostatné aplikaci Sora.

Možnosti zacházení se zvukem ale Google zatím schválně omezil. Editace mluveného slova ve videu – tedy přepsání toho, co někdo říká – je sice technicky možná, Google ji ale do první verze nezařadil. Jako důvod uvádí, že potřebuje nejprve nastavit pravidla, která zabrání zneužití (typicky deepfake). Zvuk jako vstupní reference funguje zatím pouze v podobě hlasových vzorků, další zvukové vstupy mají přibýt v nejbližších měsících.

Všechna videa vytvořená modelem Omni dále nesou neviditelný digitální vodoznak SynthID. Jeho přítomnost lze ověřit v aplikaci Gemini, v Gemini integrovaném v prohlížeči Chrome i přes Google Vyhledávání. Cílem je umožnit komukoliv rychle rozpoznat, zda jde o AI obsah.

Kde a kdy si Omni vyzkoušet

Gemini Omni Flash je dostupný od dnešního dne pro všechny předplatitele Google AI Plus, Pro a Ultra, a to v aplikaci Gemini a na platformě Google Flow. Pro uživatele YouTube Shorts a aplikace YouTube Create je model k dispozici zdarma, postupně se začne nasazovat během tohoto týdne. Pro vývojáře a firemní zákazníky pak Google přístup přes API otevře v řádu týdnů.

Vyzkoušíte si Gemini Omni na tvorbu vlastních videí?

Zdroj: Google Blog

O autorovi

Jakub Kárník

Jakub je znám svou nekonečnou zvědavostí a vášní pro nejnovější technologie. Jeho láska k mobilním telefonům začala s iPhonem 3G, ale dnes se spoléhá na… Více o autorovi

Jakub Kárník
Sdílejte: