Voice Engine: Nova IA da OpenAI capaz de replicar vozes com apenas 15 segundos de amostra

A OpenAI, empresa por trás do ChatGPT, recentemente introduziu uma nova plataforma de criação de conteúdo de forma limitada. O novo destaque é o Voice Engine, um serviço que pode criar vozes sintéticas com base em áudios de uma determinada pessoa.

Desde 2022, este sistema vem sendo desenvolvido e já teve uma parcela de sua tecnologia incorporada às APIs da empresa, que transformam texto em áudio. No entanto, somente agora a OpenAI decidiu compartilhar os resultados práticos com o público. Os exemplos dos áudios podem ser ouvidos na publicação feita no blog da empresa.

Apenas 15 segundos de amostra são suficientes

Segundo a OpenAI, basta um áudio de 15 segundos da pessoa para que o recurso consiga replicar sua voz. Mesmo que exemplos mais extensos resultem em conteúdos ainda mais detalhados e precisos, esse tempo mínimo já é o suficiente para imitar o tom e a entonação da pessoa.

Apenas 15 segundos são necessários para o Voice Engine replicar a voz.
Basta uma pequena amostra para o Voice Engine fazer a sua mágica

Até o momento, o Voice Engine foi principalmente treinado para ler textos que são digitados do zero no mesmo idioma. No entanto, ele também tem a capacidade de traduzir frases para outros idiomas, preservando até mesmo o sotaque original.

Benefícios do Voice Engine

A proposta do Voice Engine é ser utilizado principalmente por empresas do setor de informação ou educação, com o objetivo de disponibilizar conteúdos para um público mais amplo.

Durante os testes realizados em parceria com empresas desenvolvedoras, a OpenAI conseguiu criar um assistente de leitura para auxiliar crianças em fase de aprendizado, fornecendo respostas imediatas sobre diversos temas.

O Voice Engine pode ajudar muitas pessoas com deficiência a se expressarem melhor através da voz
O Voice Engine pode ajudar muitas pessoas com deficiência a se expressarem melhor através da voz

Mesmo quem possui dificuldades na fala podem se beneficiar da plataforma para se expressar melhor através da voz artificial.

IA também pode gerar problemas

Apesar do entusiasmo, a empresa reconhece que a liberação deve ser feita de forma gradual para compreender “como a sociedade pode se adaptar a essas novas capacidades”, pois há “o potencial uso inadequado de vozes sintéticas” em diversas situações.

A OpenAI participará de discussões com várias organizações nos Estados Unidos e no exterior sobre a importância do uso ético da Inteligência Artificial.

Uma das normas incluirá a proibição de reproduzir a voz de alguém sem autorização prévia, além da obrigatoriedade de informar claramente quando a fala foi gerada por meio de IA.

E você, gostou da notícia? Para mais como essa, nos siga nas redes sociais! @canaljms

CanalJMS - Tecnologia
Logo
Shopping cart