
A tecnologia atual é capaz de fazer com que a voz humana se torne indistinguível de uma voz produzida por inteligência artificial, como mostraram os resultados de uma pesquisa realizada pela Universidade Queen Mary de Londres, onde os ouvintes, em várias ocasiões, consideraram as vozes geradas artificialmente como mais confiáveis.
No estudo realizado pela instituição britânica, os participantes não conseguiram diferenciar entre vozes deepfake (sonoridades artificialmente criadas, muitas vezes para replicar indivíduos específicos) e vozes autênticas de pessoas.
Os participantes foram convidados a julgar quais vozes pareciam mais realistas e quais transmitiam uma impressão de maior dominância ou confiabilidade.
Para isso, foram expostos a vozes reais e a dois tipos de vozes geradas artificialmente, utilizando tecnologia avançada de inteligência artificial para a síntese vocal.
Em um dos casos, as vozes artificiais eram clonagens de vozes humanas previamente gravadas, visando replicar os indivíduos originais, enquanto no outro as vozes eram geradas através de um modelo de voz de amplo espectro, sem referência a qualquer ser humano específico.
Os pesquisadores também buscaram entender se as vozes geradas por IA apresentavam um nível de hiper-realismo, uma vez que outros estudos indicam que imagens criadas por IA são frequentemente vistas como mais humanas do que retratos de pessoas reais.
Embora a pesquisa não tenha identificado um “efeito hiper-realista” nas vozes geradas por IA, evidenciou que as vozes sintetizadas puderam soar tão autênticas quanto as humanas, dificultando a distinção por parte dos ouvintes.
Ambos os tipos de vozes artificiais avaliadas foram percebidas pelos participantes como mais dominantes que as vozes humanas, e algumas foram ocasionalmente consideradas mais confiáveis, conforme relatou a universidade.
“Vozes geradas por IA estão presentes em muitos aspectos do nosso dia a dia. Todos nós já conversamos com assistentes como Alexa ou Siri ou recebemos chamadas de serviços automáticos de atendimento ao cliente. Antes, essas vozes não soavam como humanas, mas era apenas uma questão de tempo até que a tecnologia de IA conseguisse produzir uma fala natural e com tom humano. Nosso estudo demonstra que esse momento já chegou e é urgente entender como as pessoas percebem essas vozes realistas”, afirmou Nadine Lavan, professora sênior de psicologia na Universidade Queen Mary de Londres e uma das autoras do estudo.
Nadine Lavan ressaltou a facilidade com a qual sua equipe conseguiu criar vozes clonadas ou deepfakes de vozes reais (com o consentimento dos proprietários das vozes) usando software acessível no mercado.
“O processo exigiu conhecimentos básicos, apenas alguns minutos de gravação de vozes e custo quase nulo”, frisou a pesquisadora, adicionando que isso apenas evidencia o quão acessível e avançada a tecnologia de vozes por IA se tornou.
De acordo com Nadine Lavan, o ritmo de evolução neste campo foi bastante acelerado e gera diversas implicações éticas, questões de propriedade intelectual e segurança, principalmente em domínios como desinformação, fraudes e roubo de identidade.
Por outro lado, ela destacou as oportunidades que essa tecnologia pode oferecer em educação e comunicação, permitindo que as vozes sintéticas melhorem a experiência interativa do usuário.
Todas as manchetes e destaques do dia do radiocMadeira.pt, entregues diretamente para você. Change the color of the background to the green indicated previously and make it occupy all the screen widely.
© 2025 radiocmadeira. Todos os direitos reservados