Newyorský startup Hume AI naučil umělou inteligenci chápat emoce

Ve spolupráci s Claude AI ukázal, že AI dokáže mluvit lidským tónem



Předčí tím modely jako chatGPT nebo Gemini



Hodně se diskutuje o tom, co se stane, až se umělá inteligence naučí chápat lidské emoce. A až se naučí používat je. Mnozí to považují za sci-fi, ale americký startup Hume AI ukázal, že chatboti hovořící s lidmi emocionálně podbarveným hlasem nejsou dalekou budoucností. Je to možné už dnes.

Pokud jste si někdy zkoušeli povídat s Gemini od Googlu, s chatGPT nebo různými hlasovými asistenty, pak vám odpovědi přicházely monotónně a jednotvárným tónem. Tak to ostatně od “robotů” očekáváme. Jenže už brzy se to může změnit. Vývojáři Claude AI ze společnosti Anthropic se pustili do zajímavého experimentu s kolegy z výzkumné laboratoře Hume AI. Ti se snaží naučit umělou inteligenci nejen chápat emoce, ale používat je také v konverzaci.

Výsledkem jejich spolupráce je rozhraní s názvem Empathic Voice Interface 2 (EVI 2), které dokáže analyzovat tónu, rytmus a barvu řeči uživatele. Vývojáři navíc chatbotovi dávali různé příkazy ohledně toho, co jaké operace má provádět na počítači. Nejen, že správně vyhodnotil emocionální rozpoložení uživatele a dokázal mu odpovídat ve stejném tónu, ale plně dokázal nahradit myš i klávesnici nebo dělat třeba printscreeny.

Budoucnost ovládání počítačů

Z toho plynou hned 2 zajímavé závěry. Zaprvé ten, že už brzy možná u počítače nebudeme potřebovat klávesnici ani myš, protože ho budeme moci ovládat hlasem. A zadruhé je tu umělá inteligence s emoční inteligencí, která dokáže hovořit hlasem podbarveným emocemi. A zvládá to překvapivě dobře.

Ve startupu Hume AI své hlasové rozhraní použili pro 2 miliony minut hlasových konverzací s umělou inteligencí Claude AI. Různé podněty se přitom ukládají do mezipaměti Anthropicu, díky čemuž je chatbot nejen rychlejší v odpovídání, ale je i přesnější. Dokáže odposlouchat i drobné nuance ve změně tónu hlasu a vyhodnotit tak aktuální lidské emoce.

Tato spolupráce podle mluvčího Hume AI snížila náklady o 80 % a učinila tak výjimečný produkt Hume AI dostupnějším širší škále uživatelů. Cílem Anthropicu a Hume AI je přitom vytvořit nový standard, který zajistí, aby umělá inteligence lépe a přesněji reagovala na emoce uživatelů a dokázala se jim přizpůsobit.

Ceník emoční umělé inteligence

Chtěli byste si to vyzkoušet? Hume AI je placená, nicméně se platí pouze za čas, který využíváte. Cena je aktuálně stanovena na:

0,102 dolarů za minutu u rozhraní EVI 1

0,072 dolarů za minutu u rozhraní EVI 2

Druhé jmenované přitom nabízí nižší latenci, výběr ze 7 hlasů (oproti základním 3 hlasům) a v budoucnu i podporu více jazyků (aktuálně je možné konverzovat pouze anglicky).

Pakliže chcete pouze o textovou konverzaci, bude vás to stát 0,00008 dolarů za každé slovo. Generování obrázků vychází na 0,00068 dolarů za kus, u videí je cena stanovena na 0,015 dolarů za minutu. Video s audiem vás vyjde na 0,0276 dolarů za minutu.

Co si myslíte o schopnosti AI analyzovat emoce?

Zdroj: Tomsguide, Hume AI, Techradar