Hlavní navigace

Počítač mluvící a rozumějící - snadno a online

18. 3. 2010 12:48 (aktualizováno) Jan Kulhánek

Rozhodl jsem se popsat různé možnosti, jak nechat náš počítač mluvit (číst text, popisovat prostředí systému…) a rozumět naší řeči. Nejprve malé ohlédnutí a pak hned příklady nejjednodušších variant jak nechat náš počítač velmi srozumitelně promluvit.

Synéza řeči není dnes na počítači ničím ohromujícím, prostě tu je a nejen v linuxu je nám k dispozici zdarma. Když jsem před více než dvaceti lety měl svůj první počítač Atari 800 XL, byl prográmek Say součístí dema, uměl jen anglicky a nejlépe mu šla fráze „To be or not to be…“ Také se řeč opatrně dostávala do her, např. v legendárním Ghost Busters (tady šlo spíš o sampl) nebo Canadian Approach. O něco málo lépe na tom byl můj další stroj – Commodore Amiga, „say“ byl součástí operačního systému, ale vzhledem ke kvalitě syntézy a absenci dalšího software prakticky k ničemu.

V 90. letech sem se čas od času setkal s počítači, upravenými pro nevidomé a slyšel jsem poprve screen-reader KUK (autor Mojžíšek) či později WinTolker a poznal jsem lidi, kteří pomocí řečové syntézy byly schopni i přes svou zrakovou vadu s počítačem pracovat. Přehledně a s ukázkami se o této problematice dočtete v Malé nahlédnutí do historie hlasových syntéz.

Dnes máme v linuxu řadu možností, jak zprovoznit screen-reader (pro zrakově postižené) nebo jak si prostě nechat přečíst text (pro kohokoliv). Začnu čtením textu – pro češtinu je nejjednodušší a zároveň nejkvalitnější hlas k dispozici v online službě přes internetový prohlížeč. Nezáleží tady na platformě a může to zvládnout i dobře vybavený smartphone.

text-to-speach

Našel jsem dvě varianty: První je Text-to-speach, graficky pěkně vivedená stránka ve Flashi, kde zvolíte jazyk, hlas (pro češtinu je k dispozici pouze Zuzana), efekt a samozřejmě zadáte text, který chcete přečíst. Pak vám muž či žena z obrazovky (reagující hlavou na polohu myši) text velmi srozumitelně přečtou.

Druhá možnost je otevřít stránku Syntéza lidské řeči (Epos…), kde najdete velké pole pro zadání textu k přečtení a volby jazyka a hlasů. Doporučuji vyzkoušet v linuxu legendární Violku, myslím, že si jí pak budete chtít nastěhovat do systému offline:-) Ale o tom příště.

Sdílet