Lar Desenvolvimento O que é texto em fala (tts)? - o que é techopedia

O que é texto em fala (tts)? - o que é techopedia

Índice:

Anonim

Definição - O que significa Text to Speech (TTS)?

O texto para fala (TTS) é um processo de modelagem de linguagem natural que requer a alteração de unidades de texto em unidades de fala para apresentação em áudio. É o oposto da fala ao texto, onde uma tecnologia capta as palavras faladas e tenta gravá-las com precisão como texto. O texto para fala agora é comum em tecnologias que buscam renderizar a saída de áudio de texto digital para ajudar aqueles que não conseguem ler ou para outros tipos de uso.

Techopedia explica Text to Speech (TTS)

O desenvolvimento da capacidade de conversão de texto em fala inclui alguns desafios exclusivos. Especialmente no idioma inglês, onde um grande número de homônimos possui pronúncias variadas, os programas de computador contam com a modelagem de probabilidade para adivinhar a pronúncia desejada de uma palavra no texto digital. O programa também precisa converter unidades de texto em fonemas, as menores unidades de pronúncia de fala. O resultado é que muitas tecnologias de conversão de texto em fala são menos do que infalíveis, embora os desenvolvedores tenham feito um grande progresso nessas tecnologias ao longo de vários anos.


Com o tempo, os especialistas observaram algumas práticas recomendadas para o desenvolvimento de TTS. Isso inclui bases de fonemas e abordagens concatenativas com análises preditivas. Os melhores programas também são capazes de trabalhar com requisitos mínimos de memória e são fáceis de configurar. Os desenvolvedores continuam trabalhando nos recursos de TTS para qualquer idioma, trabalhando com os principais desafios de ambiguidade e outros obstáculos à renderização mais precisa.

O que é texto em fala (tts)? - o que é techopedia