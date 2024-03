Umělá inteligence už není sci-fi

Stává se dostupnou i v mobilech

Nové možnosti přinášejí potřebu úpravy legislativy

Jsou to dva roky, kdy byly podobné věci k vidění pouze v americkém sci-fi. Představa, že bychom se mohli bavit s počítačem běžným jazykem, dokonce v češtině, vypadala tak vzdálená… A pak přišel rok 2022, společnost OpenAI představila ChatGPT-3.5 a způsobila poprask. A dnes už o umělé inteligenci (Artificial Intelligence, AI) slyšel snad úplně každý.

Zajímavé je, že ve skutečnosti to, s čím dnes pracujeme, není umělá inteligence v pravém smyslu. Jedná se o jazykové modely. To je mechanismus, kterému předhodíme obrovské množství textu, odborně trénovacích dat a jazykový model se tím vším prokouše. Přitom hledá závislosti a spojitosti a dokáže pak generovat smysluplný text na základě tohoto trénovacího vzorku.

Pokud se takového modelu na něco zeptáme, hledá ve svých datech výskyt podobných spojení, jaké jsme mu zadali a pokouší se najít adekvátní výstup. Když mu řekneme, aby nám řekl něco o sluneční soustavě, hledá, co má ve svých datech na toto téma a pak generuje text.

Důležité je si uvědomit, že jazykový model sám nic nedokáže vymyslet, pouze aplikuje nějaké vzorce a to, co někde četl. Pokud by se v jeho datech dostatečně rozšířila nějaká mylná informace, bude vám schopný tvrdit, že Země je placatá. Ale i tak dokáže velké věci.

Umělá inteligence a její využití

Práce s textem

Máte dlouhý text, který se vám nechce číst? Nechte si vygenerovat shrnutí článku! Umělá inteligence text „přečte“ za vás a z několikastránkového dokumentu vám připraví přehled na dva krátké odstavce. Hned tak víte, jestli je v tom textu něco dostatečně zajímavého.

Překlady

Jazykový model je geniální mimo jiné tím, že je mu jedno, jakým jazykem na něj mluvíte. Je tedy možné se s ním bavit česky, ale také ho využít k překladu. Četl jsem před časem sci-fi psané v polovině minulého století, kde hlavní postava mluví s počítačem a snaží se ho nachytat. Mluví na něj postupně esperantem, anglicky, dánsky a latinsky. A protože autor byl magor, zůstaly ty pasáže v knize nepřeložené. Zadal jsem je k překladu Chat-GPT a on, aniž jsem mu řekl, v jakém jazyce to je, všechno rozpoznal a přeložil.

Programování

Studujete-li třeba střední školu a máte předmět programování, kde po vás nějaký šílenec chce třeba bubble sort v c++, stačí říct:

Umělá inteligence vám naprogramuje třeba bubble sort

Pokud vám nevadí, že se nic nenaučíte, máte splněno.

Ale ne, tohle nemá využití jen k podvádění ve škole. Sám se programováním živím a to, že za mě někdo napíše jednoduché úlohy, je občas k nezaplacení. Kromě Chat-GPT používám ještě Github Copilot, což je jiná implementace umělé inteligence, specializující se na programování. Často stačí napsat název funkce a pokud jsem ho zvolil dostatečně dobře, Copilot mně sám nabízí dlouhé kusy kódu založené na tom, jak podobné zadání řešili lidé přede mnou, ale upravené pro mé potřeby.

Generování obrázků a videa

Kromě generování textu umí umělá inteligence dnes generovat i obrázky a dokonce i video. Z dob, kdy byly výstupy na úrovni nešikovného dítěte z mateřské školy jsme se dostali k fotorealistickým obrázkům a videím, kde musíme opravdu pozorně hledat chyby. Zde jsem zkoušel například navrhnout logo na své fotografické stránky.

Využití je samozřejmě obrovské. V případě obrázků nemusíme platit grafika, ale necháme si obrázek třeba do reklamy vygenerovat. Photoshop, ale i mobilní aplikace nabízejí generování částí obrazu. Stalo se mi, že si klient vybral fotku, na které mu chyběla část nohy. Před rokem bych se musel omluvit, že to nejde, teď jsem tu nohu během pár sekund nechal Photoshop dokreslit.

U videa stačí natočit krátký klip a umělá inteligence vygeneruje záznam, kde čtete jakýkoliv text. Postava ve videu má váš obličej, váš hlas, vaše gesta. Potřebujete zvuk nebo melodii? I to je dnes možné, sám jsem si takto generoval zvukový doprovod ke krátkým videím.

Co můžeme čekat v roce 2024

Bude to velké. Svá řešení umělé inteligence přestavuje jedna společnost za druhou. Kromě Chat-GPT zde máme Gemini od Google, Copilot od Microsoftu, nejnovější mobily od Samsungu jsou letos vyloženě postavené na umělé inteligenci, za vrchol považuju překlad telefonních hovorů.

Překlad hovoru v reálném čase

Už dlouho známe různé chatboty, ale nyní budou mnohem chytřejší a méně rozeznatelní od člověka. Budou schopní s vámi mluvit tak, abyste se cítil komfortně a nebudou to jen jednoduché reakce na klíčová slova. Umím si představit, že zadám takovému asistentovi požadavek na vyhledání optimální cesty z místa A do místa B a on nejen, že najde spojení, ale zajistí jízdenky, zabookuje hotel a navrhne program na volný čas.

Představte si dále, že si umělá inteligence vezme diskuse pod největšími technologickými servery, projde je, detekuje vyloženě provokativní komentáře a ze zbytku určí reakce lidí na novinky a požadavky a podle toho nějaký výrobce vybuduje strategii pro další roky. To by nebylo vůbec špatné, že? A právě na analýzu podobného typu dat je současná umělá inteligence vyloženě dělaná.

Umělá inteligence umí a bude ještě lépe umět předcházet problémům. Dokáže včas odhadnout riziko zdravotních potíží, jako je například rakovina, ale i jiné, a to třeba jen z dat pořízených chytrými hodinkami. Samsung má například certifikát na detekci apnoe v Koreji a USA. Propojení umělé inteligence a dat z různých senzorů skýtá obrovské možnosti.

Dostupnost

Jsme ve fázi, kdy se společnosti předhánějí, co dokáží předvést. Výrobci mobilů se snaží umělou inteligenci integrovat přímo do zařízení, ostatní nabízejí své služby, jak se dá a také se snaží o integraci s nástroji, se kterými to dává aspoň trochu smysl.

Umělá inteligence je kamarád

Github Copilot nabízí své funkce ve vývojových prostředích, Microsoft Copilot zase v Office 365 a snaží se proniknout do Windows 11 a nejnověji jej lze dokonce nastavit v telefonech s Androidem jako asistenta!

Pokud se zaměříme na dostupnost v mobilech, první byl asi Google a umělá inteligence v Pixelech, kde nabízel například zpracování obrázků. Bohužel Google využíval pro zpracování své servery a uživatelé měli pak pochopitelné obavy o svá data.

Dalším velkým hráčem je Samsung, který letos v nejnovější řadě Galaxy S24 představil poměrně zajímavé funkce, počínaje generováním částí obrázku, přes práci s textem (umí například změnit styl textu, aby byl formální nebo jej naopak opatří hashtagy nebo smajlíky), nabízí už zmíněné shrnutí textu, ale také formátování poznámek, přepis záznamu porady do textu včetně přiřazení k jednotlivým účastníkům, až po překlad telefonního hovoru, kdy vy mluvíte v jednom jazyce a druhá strana v jiném a telefon průběžně překládá.

Čeština je slíbená během letošního roku. A co je hodně skvělé, že velká část funkcí se zpracovává pouze v telefonu, nic se nikam neposílá. Funkce, které potřebují server, jdou zcela vypnout, takže se nemusíte obávat o únik důvěrných informací. V tomto Samsungu můžeme jen zatleskat.

Kdo to zaplatí?

Umělá inteligence potřebuje ke své činnosti neuvěřitelné množství výkonu. Využívá se drahý hardware, spotřebovává se spousta energie. Nelze opomenout ani obrovské investice do vývoje software. První období, kdy se umělá inteligence učila a lidé si na ni zvykali, končí a je třeba odpovědět na otázku, jak dál. Samsung se letos při představení řady S24 s umělou inteligencí zavázal, že umělá inteligence nebude zpoplatněna do konce roku 2025. A přestože je tento výrok vlastně pozitivně laděný, okamžitě si to někteří lidé přeložili jako “a pak to zpoplatníme”. Je to odůvodněný předpoklad? Jsou vlastně tři možnosti:

z umělé inteligence se stane naprosto běžná věc , bude to mít každý a pokus o zpoplatnění by vedl jen k odlivu zákazníků

, bude to mít každý a pokus o zpoplatnění by vedl jen k odlivu zákazníků ukáže se, že dosáhnout opravdu kvalitních výsledků není úplně jednoduché a dokáže to jen několik málo společností a pak nějaká forma platby připadá v úvahu

a dokáže to jen několik málo společností a pak nějaká forma platby připadá v úvahu nastane něco mezi, kdy sice kvalitní umělá inteligence bude běžná, ale náklady budou tak vysoké, že nebude možné je rozpustit v ceně zařízení a společnosti nabídnou nějaký paušál

Kdo to zaplatí?

V současné době převládá přístup, kdy společnosti nabízí nějakou trial verzi nebo nižší výkon zdarma, ale můžete si zaplatit vyšší prioritu nebo novější možnosti. To je případ Chat-GPT nebo Copilotu ve Windows. Můžete využívat zdarma mírně omezené možnosti, ale můžete zaplatit a pak máte k dispozici plnou sílu platformy. Pokud používáte Windows 11 a Edge, máte k dispozici část jinak placených možností Chat-GPT zdarma. Naopak Github Copilot nabízí jen krátkou zkušební verzi a pak už buď platíte nebo máte smůlu. Pozitivem je, že cena není nijak dramatická. Adobe implementoval generativní grafiku Firefly do Photoshopu a je k dispozici zdarma, ale očekává se zpoplatnění.

Legislativa

Zjišťujeme, že umělá inteligence je dobrý sluha, ale také tak trochu plagiátor. Už u generovaného textu se ozývali autoři, že výsledek je založený na jejich práci. Kdo si koupí učebnici, když je její obsah k dispozici na jednoduchý dotaz?

Je lehké stát se plagiátorem

U generování obrazů narážíme na dva problémy. Jedním z nich je autorský rukopis. Umělá inteligence umí vzít obrázek a předělat ho tak, že bude vypadat jako od známého malíře nebo fotografa. A to se samozřejmě nelíbí nikomu (kromě uživatelů), protože tím klesá exkluzivita daného autora.

Ještě větší problém je ale generování obrázků s reálnými lidmi v nereálných situacích. Mediálním prostorem proběhly fake nahé fotky celebrit, ale tohle jsou pořád “klukoviny” ve srovnání s tím, co dokáže fake fotka nebo dokonce video během volební kampaně! Už při minulých volbách se hojně šířily obrázky ohýbající realitu, ale tehdy šlo o dohledatelné fotky nebo neumělé montáže. Mám dost velké obavy o férovost během nadcházejících volebních kampaní.

Na druhé straně už nyní narážíme na to, jak uchopit výstup, na kterém se podílela umělá inteligence. Je autorem ten, kdo zadal příkaz (prompt) nebo umělá inteligence? Umělá inteligence ale není člověk, tak co s tím? Co když student donese práci, kde využíval umělou inteligenci, je to v pořádku, protože dokázal splnit zadání nebo ne, protože se uměl jen zeptat? A jaký je vlastně rozdíl v tom, ptát se Googlu a ptát se umělé inteligence? Na všechny tyto otázky musíme najít brzo odpověď.

A co vy? Používáte umělou inteligenci? Spíše si s ní jen hrajete, nebo vám slouží ke studiu či práci?