Google právě ukázal Gemini Omni! Tvoří videa, která vám vyrazí dech Hlavní stránka Zprávičky Google na konferenci I/O 2026 představil nový generativní model Gemini Omni zaměřený zatím na tvorbu videa Model přijímá libovolnou kombinaci vstupů – text, obrázek, video i zvukovou stopu – a vytvoří z nich jediný výsledný klip Varianta Omni Flash je dostupná již dnes pro předplatitele Google AI Plus a vyšší, na YouTube Shorts pak zdarma Sdílejte: Jakub Kárník Publikováno: 20.5.2026 12:00 2 komentáře 2 Loni v září Google ukázal model Nano Banana, který se rychle stal jedním z nejpoužívanějších nástrojů pro úpravu fotografií pomocí umělé inteligence. Lidé s ním obnovovali staré rodinné snímky, převáděli skici na fotorealistické obrázky nebo vizualizovali designové nápady. Letos Google posouvá stejný princip o úroveň výš – přichází Gemini Omni, model schopný stejnou logiku aplikovat na video. Editace videa konverzací, ne posuvníky Fyzika, znalosti a vizuální vysvětlovače Vlastní avatar a opatrnost s hlasem Kde a kdy si Omni vyzkoušet Omni je nová rodina generativních modelů od Googlu, kterou firma představila na konferenci Google I/O 2026. První zástupce – Gemini Omni Flash – se od dnešního dne začíná postupně zpřístupňovat uživatelům aplikace Gemini, platformy Google Flow a také tvůrcům na YouTube Shorts. Druhý a výkonnější model označený Omni Pro Google zatím jen zmínil, detaily uvolní postupně. Editace videa konverzací, ne posuvníky Hlavní novinkou Omni není ani tak samotné generování videa – to umí konkurenční modely typu OpenAI Sora, Runway nebo Meta Movie Gen už delší dobu. Důraz Google klade na konverzační úpravu. Uživatel zadá videoklip a běžnou řečí popisuje, co se s ním má stát: změnit prostředí, přidat postavu, upravit pohyb kamery. Každá další instrukce navazuje na předchozí, scéna si pamatuje kontext a postavy zůstávají vizuálně konzistentní. Ve zveřejněných ukázkách například zadání „udělej tu sochu z bublin“ promění mramorovou plastiku v plovoucí strukturu z mýdlových bublin, a to bez nutnosti cokoliv ručně maskovat. Jiná ukázka pak po dotyku ruky promění zrcadlo v pohyblivou tekutinu a paži postavy v reflexní materiál. Veškerou tuto práci dříve obstarávali specialisté ve studiích, často s rozpočty v řádech tisíců dolarů za jediný záběr. Fyzika, znalosti a vizuální vysvětlovače Google při představení Omni opakovaně zdůrazňoval, že model nestaví scény jen vizuálně přesvědčivě, ale chápe i to, jak by se měly chovat. Modelu byly vylepšeny schopnosti práce s gravitací, kinetickou energií i dynamikou kapalin. V jedné z ukázek se kulička valí po zalomené dráze ve stylu řetězové reakce – pohyb i zvukové efekty každého odrazu odpovídají skutečnosti. Druhým pilířem je propojení s tím, co Gemini „ví“ o světě. Omni dokáže vyrobit krátký vizuální vysvětlovač komplexní problematiky – jednou z prezentovaných ukázek je stop-motion animace ve stylu claymation, která vysvětluje proces sbalování bílkovin (protein folding). Z krátkého textového zadání tak může vzniknout obsah, jehož ruční výroba by zabrala dny. Tento přístup navazuje na dlouhodobou snahu Googlu vybudovat tzv. world model – model, který chápe svět jako koherentní celek, ne jako sled náhodných pixelů. Stejnou filozofii firma uplatňuje i u experimentálního modelu Genie, který generuje interaktivní herní prostředí. Genie nicméně zůstává dostupný pouze předplatitelům nejvyššího tarifu AI Ultra. Vlastní avatar a opatrnost s hlasem Omni umí do videí vložit i digitálního dvojníka uživatele. Funkce Avatar vytvoří podle zadaných vzorků digitální verzi člověka, která ve výsledných videích mluví jeho hlasem. Podobnou cestou se loni vydal OpenAI ve své – mezitím už zrušené – samostatné aplikaci Sora. Možnosti zacházení se zvukem ale Google zatím schválně omezil. Editace mluveného slova ve videu – tedy přepsání toho, co někdo říká – je sice technicky možná, Google ji ale do první verze nezařadil. Jako důvod uvádí, že potřebuje nejprve nastavit pravidla, která zabrání zneužití (typicky deepfake). Zvuk jako vstupní reference funguje zatím pouze v podobě hlasových vzorků, další zvukové vstupy mají přibýt v nejbližších měsících. Všechna videa vytvořená modelem Omni dále nesou neviditelný digitální vodoznak SynthID. Jeho přítomnost lze ověřit v aplikaci Gemini, v Gemini integrovaném v prohlížeči Chrome i přes Google Vyhledávání. Cílem je umožnit komukoliv rychle rozpoznat, zda jde o AI obsah. Kde a kdy si Omni vyzkoušet Gemini Omni Flash je dostupný od dnešního dne pro všechny předplatitele Google AI Plus, Pro a Ultra, a to v aplikaci Gemini a na platformě Google Flow. Pro uživatele YouTube Shorts a aplikace YouTube Create je model k dispozici zdarma, postupně se začne nasazovat během tohoto týdne. Pro vývojáře a firemní zákazníky pak Google přístup přes API otevře v řádu týdnů. Vyzkoušíte si Gemini Omni na tvorbu vlastních videí? Zdroj: Google Blog O autorovi Jakub Kárník Jakub je znám svou nekonečnou zvědavostí a vášní pro nejnovější technologie. Jeho láska k mobilním telefonům začala s iPhonem 3G, ale dnes se spoléhá na… Více o autorovi Sdílejte: 2 komentáře Vložit komentář AI Gemini Google Google I/O Mohlo by vás zajímat Android Auto dostane schopnějšího asistenta! Takto (zhruba) vypadá Gemini v akci Adam Kurfürst 9.1.2025 Android Auto dostává první letošní aktualizaci. Co je nového? Adam Kurfürst 10.1.2025 Google Quick Share přináší pro všechny skvělou funkci, kterou už Samsung umí dávno Libor Foltýnek 8.1.2025 Google se chystá nasadit Gemini na chytré hodinky s Wear OS. Můžeme čekat češtinu? Libor Foltýnek 8.1.2025 Fotky Google mají novou utajenou funkci. Už jste ji objevili? Jana Skálová 24.12.2024 Pixel 9 Pro má problém! Některým mobilům prý odpadává fotoaparát Jana Skálová 7.1.2025