Montagens utilizando vozes sapi. O que é?

Montagens sapi é a conversão de texto em áudio e a edição do mesmo.
Todos os tipos de textos podem ser convertidos em fala utilizando uma voz sintetizada, chamada de Sapi. A sigla Sapi quer dizer (Speech Aplication Programming Interface), que é a interface usada para uma voz funcionar.
Uma voz Sappi funciona da seguinte forma:
1. o texto é passado para uma biblioteca onde ele é reconhecido e processado pela máquina.
2. Checa-se uma biblioteca gramatical e uma outra contendo frases e eventos programados e, em seguida, o texto é sintetizado em voz.
Não me aprofundarei muito no quezito programação de sintetizadores, isso fica para um próximo post.
Para gravar um texto falado em mp3, WAV, OGG, WMA, ou qualquer outro formato, você precisa ter um conversor de texto para áudio. Estes conversores pegam o texto que você deseja e o gravam com a voz SAPI escolhida por você.
Hoje em dia é bastante comum o uso desta facilidade tanto por pessoas cegas quanto por pessoas que enxergam.
Empresas por exemplo, tem seus sistemas eletrônicos via telefone utilizando uma voz SAPI. Alguns Youtubers também se utilizam desta técnica para postar vídeos com notícias em seus canais.
Já na comunidade de deficientes visuais, é comum o uso destes programas para construir histórias com várias vozes SAPIS interagindo entre si, formando assim diálogos interessantes.
Como isso é feito?
1. O seu texto escrito precisa ser dividido em várias partes para se montar os diálogos.
2. Cada parte do texto deve ser gravada no formato desejado com a voz sapi de sua preferência, por exemplo, Raquel e Felipe.
Para montagens deste tipo, utiliza-se para gravar o texto em áudio um programa chamado DSpeech, que permite a alteração de vozes independentes, e a inserção de aspas no texto para a alternância de voz. Tudo o que estiver entre aspas o programa irá reproduzir com uma voz feminina, por exemplo, e tudo que estiver fora das aspas o programa irá reproduzir com a voz padrão, uma voz masculina, por exemplo.
Após reproduzir o diálogo com as duas primeiras vozes e gravar o texto, você precisa repetir este processo até que todos os seus diálogos estejam formados.
Falei do DSpeech para a gravação de texto em áudio, pois ele permite criar diálogos sem muito trabalho.
Existem outras pessoas que fazem isto utilizando o método tradicional, onde cada fala do texto é gravada com uma voz SAPI diferente, deixando o processo mais longo.
Depois de salvar cada arquivo na ordem correta dos diálogos, é necessário utilizar um editor de áudio para unificar estes arquivos na ordem correta e por fim editar a junção colocando efeitos ambientais como, eco, reverberação etc.
Após isso entram os efeitos sonoros e músicas de fundo, ficando a seu critério se vai fazer algo sofisticado ou simples.
Após todo o trabalho feito é só salvar o áudio em um formato de sua preferência e divulgar sua arte para o mundo.
Chamo de arte porque para mim, quem mexe com este tipo de coisa necessita de muita paciência, calma e tempo para produzir algo legal e criativo.
Existem vários editores de áudio para todos os gostos, e cada um com suas particularidades.
Infelizmente, a maioria dos editores de áudio presentes no mercado são em inglês. Existem alguns editores de áudio que são intuitivos, facilitando a compreensão por pessoas que não falam o idioma.
Basta escolher um de sua preferência, estudar sobre ele e começar a editar.
Não abordei aqui sobre nenhum editor de áudio específico, pois cada um tem suas preferências e está acostumado com um tipo de editor.
Atenciosamente:
Lorran!

Montagens utilizando vozes sapi. O que é?

Deixe um comentário

Publicado por Lorran Davis

Compartilhe isso:

Relacionado

Deixe um comentário

Publicado por Lorran Davis