A OpenAI, empresa por trás do ChatGPT, recentemente introduziu uma nova plataforma de criação de conteúdo de forma limitada. O novo destaque é o Voice Engine, um serviço que pode criar vozes sintéticas com base em áudios de uma determinada pessoa.
Desde 2022, este sistema vem sendo desenvolvido e já teve uma parcela de sua tecnologia incorporada às APIs da empresa, que transformam texto em áudio. No entanto, somente agora a OpenAI decidiu compartilhar os resultados práticos com o público. Os exemplos dos áudios podem ser ouvidos na publicação feita no blog da empresa.
Apenas 15 segundos de amostra são suficientes
Segundo a OpenAI, basta um áudio de 15 segundos da pessoa para que o recurso consiga replicar sua voz. Mesmo que exemplos mais extensos resultem em conteúdos ainda mais detalhados e precisos, esse tempo mínimo já é o suficiente para imitar o tom e a entonação da pessoa.
Até o momento, o Voice Engine foi principalmente treinado para ler textos que são digitados do zero no mesmo idioma. No entanto, ele também tem a capacidade de traduzir frases para outros idiomas, preservando até mesmo o sotaque original.
Benefícios do Voice Engine
A proposta do Voice Engine é ser utilizado principalmente por empresas do setor de informação ou educação, com o objetivo de disponibilizar conteúdos para um público mais amplo.
Durante os testes realizados em parceria com empresas desenvolvedoras, a OpenAI conseguiu criar um assistente de leitura para auxiliar crianças em fase de aprendizado, fornecendo respostas imediatas sobre diversos temas.
Mesmo quem possui dificuldades na fala podem se beneficiar da plataforma para se expressar melhor através da voz artificial.
IA também pode gerar problemas
Apesar do entusiasmo, a empresa reconhece que a liberação deve ser feita de forma gradual para compreender “como a sociedade pode se adaptar a essas novas capacidades”, pois há “o potencial uso inadequado de vozes sintéticas” em diversas situações.
A OpenAI participará de discussões com várias organizações nos Estados Unidos e no exterior sobre a importância do uso ético da Inteligência Artificial.
Uma das normas incluirá a proibição de reproduzir a voz de alguém sem autorização prévia, além da obrigatoriedade de informar claramente quando a fala foi gerada por meio de IA.
E você, gostou da notícia? Para mais como essa, nos siga nas redes sociais! @canaljms