Znáte někoho, kdo má poruchu řeči a jako kompenzační pomůcku používá přístroj pro generování syntetického hlasu? Minimálně ve filmu, v seriálu nebo třeba v záběrech legendárního vědce Stephena Hawkinga v jeho pokročilém věku jste to jistě viděli a slyšeli. Výsledkem je převážně monotónní robotický hlas, který se tomu reálnému v mnoha ohledech nepodobá. O eliminaci této nepříjemnosti se již nějakou dobu pokouší Xiaomi se svým vlastním řešením tzv. Text-To-Speech (TTS) v rámci projektu Own My Voice.

V rámci výzkumu, jenž od roku 2017 vede tým Xiaomi AI Lab, vytvořili vědci umělou inteligenci, která je schopná hlasově postiženému člověkovi vygenerovat příjemnější a přirozenější hlas vyrobený na základě audio stop od dvou stovek různých dobrovolníků. Prakticky jde o další level předříkání, které poskytují například Google, Microsoft či jiné firmy, vložený do kompenzační pomůcky.

“Technologie v podstatě způsobuje, že se syntetizovaný hlas se svou intonací, pauzami, rychlostí a dalšími vlastnostmi podobá skutečnému lidskému hlasu. Monotónní a nepřirozený pocit z elektronického hlasu je tak nahrazen přirozenějším. V současné době se tato technologie uplatňuje v mnoha chytrých zařízeních vybavených hlasovým asistentem Xiaoai,” popisuje firma s tím, že chce projekt dále rozvíjet.

Kolik znáte lidí s hlasovým generátorem?

Zdroj: TZ