Syntéza řeči

Syntéza řeči je umělá tvorba lidské řeči. Počítačové programy používané k tomuto účelu se nazývají „syntezátory řeči“. Programy „text na řeč“ (text-to-speech, TTS) produkují řeč z textu psaného běžným jazykem; existují i programy, které jako vstup využívají fonetickou transkripci.[1] Řeč může být tvořena spojováním úseků nahrané řeči, které jsou uloženy v databázi. Takovéto databáze mohou obsahovat např. fóny a difóny nebo celá slova. V prvním případě je kvantita možného výsledku upřednostňována před kvalitou, v druhém je to naopak. Některé syntetizátory mohou řeč tvořit simulací charakteristik lidské řeči a vytvářet tak doslova umělou řeč.[2]

Stephen Hawking byl jeden z nejznámějších lidí, kteří ke komunikaci používali syntézu řeči.

Kvalita syntetizátoru řeči se posuzuje podle podobnosti výstupu s lidskou řečí. Schopné programy umožňují lidem se zrakovými vadami nebo poruchami čtení poslouchat psané texty. Mnoho operačních systémů obsahuje syntetizátory řeči od počátku 80. let.

Odkazy

Reference

V tomto článku byl použit překlad textu z článku Speech synthesis na anglické Wikipedii.

  1. Jonathan Allen, M. Sharon Hunnicutt, Dennis Klatt, From Text to Speech: The MITalk system. Cambridge University Press: 1987. ISBN 0-521-30641-8
  2. RUBIN, P.; BAER, T.; MERMELSTEIN, P. An articulatory synthesizer for perceptual research. Journal of the Acoustical Society of America. 1981, s. 321–328. DOI 10.1121/1.386780. (anglicky)

Externí odkazy

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.