Google Bard přidává Gemini! Zatím nejschopnější model umělé inteligence

Google Gemini
  • Google představil multimodální model Gemini
  • Dokáže zpracovávat různé typy souborů
  • Už nyní je dostupný v rámci Barda a pro Pixel

Google představuje svojí multimodální umělou inteligenci, která je označována za jednu z těch nejflexibilnějších a nejsofistikovanějších modelů. Gemini dokáže zobecnit informace, bezproblémově porozumět zadání a na rozdíl od konkurenčních systémů dokáže kombinovat různé typy informací. To znamená, že je schopen rozumět textu, fotkám, zvukům, videím a dokonce i kódovacímu jazyku. Nabídne 3 různé verze, a jedna z nich je už nyní dostupná pro širokou veřejnost v rámci předchozí generace AI Bard a také pro telefony Pixel.

Gemini je výsledkem spolupráce mezi Googlem, DeepMind a Google Research a jedná se o zatím o dosud největší vědecký a inženýrský projekt. Nová AI má za cíl změnit způsoby, jakým podnikatelé i spotřebitelé fungují s podobnými modely a chtějí nabídnout komplexního pomocníka do každého dne. A kromě toho umožňuje integraci a propojení od mobilních zařízení až po velká datová centra, která zpracovávají obrovské množství dat.

Tři verze, avšak dočkáme se jich postupně

Gemini 1.0 bude dostupný ve třech základních verzích, avšak uvolňovány budou postupně. V první fázi byl v Bardu spuštěn Gemini Pro, který je sice v pokročilé fázi uvažování, ale zatím dokáže rozumět a zpracovávat zadání jen v angličtině. Gemini Nano verze je k dispozici pro zařízení Android. V následující fázi začátkem příštího roku dorazí nový Bard Advanced, který bude mít přístup k modelu Gemini Ultra. Toto postupné zveřejňování je díky probíhajícímu testování. Google chce zajistit, aby byl model bezpečný, dokázal si pamatovat, ověřovat informace a zvládnul se učit z vlastních chyb.

Gemini rozumí a kombinuje různé typy informací

Gemini je tzv. nativně multimodální model, což znamená, že bude schopen zpracovávat a integrovat více vstupů či dat. Na rozdíl od jiných modelů dokáže identifikovat i videa či zvuky na jednom místě, což by mohlo zefektivnit zpracování a interpretaci datových souborů. Porozumí textu, dokáže racionálně uvažovat a kódovat. Dle benchmark testů textu v šesti z osmi případů dokonce verze Ultra překonala GPT-4.

gemini-ultra-vs-gp4

Google nezapomněl ani na vývojáře

Gemini splní potřeby jak spotřebitelům, tak vývojářům. Vývojáři budou moci využívat Gemini Pro prostřednictvím API v Google AI Studio a Vertex AI. Google AI studio je bezplatný nástroj pro vývoj aplikací, zatímco Vertex AI zase nabídne pokročilejší správu s důrazem na bezpečnost a správu dat. Pro uživatele Androidu, vývojáře bude k dispozici Gemini Nano prostřednictvím AICore v Androidu 14(od Pixel 8 Pro).

Interaktivní test modelu na papírové raketce

Google je známý tím, že své produkty prezentuje na zajímavých interaktivních videích. Tentokrát ve spojení s Youtuberem Markem Roberem, pomocí Barda v kombinaci s Gemini Pro verzí, speciálně vyladili papírovou vlaštovku/letadlo. Bard dokázal vygenerovat model letadla se kterým následně provedl řadu letových testů. Následně navrhl razantní zvětšení modelu a poskytnul rady, jak techniku vylepšit. Na závěr Bard dokázal přesně napsat, proč určité lety nebyly úspěšné – tím ušetřil nejen čas, ale poskytl praktické tipy, které by zabraly několik týdnů výzkumu.

Mark Rober takes Bard with Gemini Pro for a test flight

Mark Rober takes Bard with Gemini Pro for a test flight

Myslíte, že má šanci konkurovat ChatGPT?

Zdroj: Blog.Google, 9to5Google

Zuzana Přibylová
O Autorovi - Zuzana Přibylová

Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… více o autorovi

Mohlo by vás zajímat

Komentáře (0)