TOPlist

Gemini bude rozumět světu jako člověk – taková je vize společnosti Google!

  • Google chce z Gemini vytvořit „světový model“ – tedy AI, která chápe a simuluje okolní svět
  • Cílem je univerzální asistent, který zvládne plánování, reagování na kontext a práci napříč zařízeními
  • Projekt Mariner testuje AI schopnou plnit více úkolů najednou, a to i mimo prohlížeč

Sdílejte:
Pavlína Čížková
Pavlína Čížková
21.5.2025 16:00
Ikona komentáře 3
Gemini jako světová AI

Společnost Google se v rámci včerejšího Google I/O rozhodně nebála jednoho: překvapovat diváky programu přelomovými novinkami na poli umělé inteligence. To se ale vzhledem k dřívějším projektům společnosti dalo očekávat, jelikož její portfolio v rámci AI je skutečně rozsáhlé – například vyvinula architekturu Transformer, na níž jsou postavené všechny dnešní jazykové modely (včetně ChatGPT), nebo systémy AlphaGo a AlphaZero, které dokážou plánovat a učit se jako „agenti“.

Tyto technologie dnes Google aplikuje na široké spektrum oborů – od kvantových výpočtů přes matematiku až po vědy o živé přírodě. Cílem je posunout hranice výzkumu a přiblížit se tomu, co bývá nazýváno zkratkou AGI (obecná umělá inteligence) – tedy inteligenci, která zvládne rozmanité úkoly napříč obory podobně jako lidský mozek.

Nyní chce Google svůj nejvyspělejší multimodální model Gemini 2.5 Pro proměnit v tzv. „světový model“.

Světový model zní ambiciózně – ale co to vlastně znamená?

Jde o umělou inteligenci, která nejen rozumí textu, ale také chápe a simuluje reálný svět – například dokáže plánovat, předvídat, reagovat na změny prostředí a „představit si“, co se stane dál. Takové schopnosti jsou zásadní pro vytvoření AI asistenta, který se skutečně vyzná ve vašem světě a jeho kontextu.

Inspirací se zde staly již dřívější projekty Googlu jako Genie 2, který z jednoho obrázku vygeneruje interaktivní 3D svět, nebo Gemini Robotics, kde se umělá inteligence učí ovládat roboty v reálném prostředí.

Cílem je tedy přetvořit aplikaci v univerzálního asistenta, který například plně chápe, co právě děláte, anebo umí plánovat a jednat ve vašem zastoupení. Stejně tak by měl pracovat napříč více zařízeními a platformami a šetřit vám tak čas tím, že vám odlehčí od rutinních úkolů.

To vše se začíná dít díky projektu Astra – výzkumného prototypu z loňského roku, který kombinuje rozpoznávání obrazu, sdílení obrazovky a paměť. Postupně se tyto funkce dostávají i do Gemini Live, kde už Google testuje třeba plynulejší hlasový výstup.

Google navíc plánuje podobné funkce integrovat i do vyhledávání, API pro vývojáře a dalších zařízení; například do takových chytrých brýlí.

Gemini za vás vyřídí více věcí naráz

Další novinky přináší i projekt Mariner, který testuje, jak může umělá inteligence plnit více úkolů zároveň. Od prosince probíhá testování s vybranými uživateli a výsledky jsou slibné: umělá inteligence v prohlížeči zvládne až deset paralelních úkolů, jako je hledání informací, rezervace, nákup nebo rešerše.

AI Project Mariner hledá recept na guláš

Tato funkce je už dostupná předplatitelům Google AI Ultra v USA, a část z ní se brzy objeví i v dalších Google produktech včetně vyhledávání a samotné aplikace Gemini.

Co myslíte? Zvládne Google dotáhnout vizi světového modelu?

Zdroj: Blog Google

O autorovi

Pavlína Čížková

Pája nemálo kdy slýchá, že vypadá, jako by do přítomnosti přišla z cyberpunkového budoucna. Nejen svou prezentací, ale i svými zájmy dává veřejnosti každý den… Více o autorovi

Pavlína Čížková
Sdílejte: