A figura apresenta aspectos do sinal de fala correspondente à palavra (Foto: Divulgação)
Empresa residente na Incamp desenvolve software que transforma palavras escritas em faladas, por meio de vozes produzidas sinteticamente. Primeiro protótipo do conversor em português deverá estar pronto até julho deste ano
Empresa residente na Incamp desenvolve software que transforma palavras escritas em faladas, por meio de vozes produzidas sinteticamente. Primeiro protótipo do conversor em português deverá estar pronto até julho deste ano
A figura apresenta aspectos do sinal de fala correspondente à palavra (Foto: Divulgação)
Agência FAPESP - Um novo programa de computador que dá voz de alta qualidade a palavras escritas em português encontra-se em um estágio final de desenvolvimento. A tecnologia está sendo desenvolvida pela Vocalize, empresa residente na Incubadora de Empresas de Base Tecnológica da Universidade Estadual de Campinas (Incamp), e a previsão é que o primeiro protótipo do software esteja pronto até julho deste ano.
"A tecnologia para conversão de texto em fala vem sendo desenvolvida há décadas, mas somente nos últimos anos é que ela passou a ser capaz de produzir fala com alta naturalidade", disse o engenheiro eletricista responsável pelo projeto, Edmilson da Silva Morais, à Agência FAPESP. Segundo ele, já existem conversores comerciais de texto em fala nos Estados Unidos e na Europa, mas apenas em versões da língua de origem desses países.
"Esse tipo de tecnologia, que é altamente dependente de características específicas da língua que se deseja sintetizar, tem evoluído significativamente em todo o mundo e o mercado brasileiro está começando a se interessar pelo assunto", explica o doutor em engenharia de telecomunicações.
A tecnologia empregada pela Vocalize em seu conversor de texto em fala utiliza um banco de frases escritas e faladas, devidamente segmentadas em pequenas unidades de som que podem ser, por exemplo, um fonema ou uma sílaba. A partir dessas unidades de som, o programa sintetiza a voz humana e automaticamente transforma palavras escritas em faladas, dando ritmo e entonação semelhantes aos da voz humana.
Por meio de modelos matemáticos estatísticos, o programa é treinado para fazer uma análise sintática das sentenças e das vozes que podem ser utilizadas em cada situação. Entre as aplicações práticas da tecnologia estão sistemas para vocalização de e-mail em telefones celulares e a vocalização de notícias curtas de jornais e revistas por meio da internet.
"Além de aplicações que auxiliam na mobilidade empresarial, os deficientes visuais também serão grandes beneficiários da tecnologia", explica o pesquisador. "O lançamento comercial do software está previsto para meados de 2009", disse Morais.
Com apoio do Programa Inovação Tecnológica em Pequenas Empresas (Pipe), da FAPESP, o trabalho foi desenvolvido em parceria com lingüistas, engenheiros e cientistas da computação de instituições como a Faculdade de Engenharia Elétrica e Computação (Feec) e o Instituto de Estudos da Linguagem (IEL), ambos da Unicamp, e o Núcleo Interinstitucional de Lingüística Computacional (Nilc), da Universidade de São Paulo (USP), em São Carlos.
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.