Índice:
Definição - O que significa Síntese de Fala?
A síntese de fala é uma simulação artificial da fala humana com um computador ou outro dispositivo. A contrapartida do reconhecimento de voz, a síntese de fala, é usada principalmente para traduzir informações de texto em informações de áudio e em aplicativos como serviços habilitados para voz e aplicativos móveis. Além disso, também é usado em tecnologia assistiva para ajudar pessoas com deficiência visual na leitura de conteúdo de texto.
Techopedia explica síntese de fala
O VODER de Homer Dudley, baseado no codificador de vocais da Bell Laboratories, é considerado o primeiro sintetizador de voz totalmente funcional. O computador usado na síntese de fala é conhecido como sintetizador de fala ou computador de fala. A qualidade do computador de fala é frequentemente julgada por sua semelhança com a voz humana. A maioria dos sistemas operacionais de computadores incorporou sintetizadores de fala desde o início dos anos 90. A fala sintetizada geralmente é gerada com a ajuda da concatenação de partes da fala gravada, contidas em um banco de dados.
O estágio inicial da síntese da fala é o pré-processamento, que elimina a ambiguidade em torno da maneira pela qual a palavra específica precisa ser lida, e que também inclui o manuseio de homógrafos. No próximo estágio da síntese da fala, o computador utiliza a ajuda dos fonemas para converter o texto em sequência de sons. O último estágio envolve o uso de gravações humanas ou técnicas básicas de geração de som para imitar o mecanismo da voz humana e ler o texto inteiro. Um dos ramos populares da síntese de fala é a síntese de fala audiovisual ou síntese de fala multimodal, que utiliza uma face animada fortemente sincronizada para complementar a fala sintetizada. A síntese de fala multimodal também incorpora recursos adicionais, como dicas não verbais, para ajudar na comunicação das palavras do usuário com mais precisão. Muitos sistemas de síntese de fala permitem que os usuários escolham o tipo de voz, como voz masculina ou feminina.
A maioria dos sistemas de síntese de fala é capaz de ler textos e produzi-los de uma maneira muito inteligente, embora a voz às vezes seja monótona. A síntese da fala, no entanto, ainda está para desenvolver a capacidade de imitar completamente o amplo espectro de entonações e cadências humanas.