A Microsoft Research Ásia revelou uma nova ferramenta experimental de IA chamada VASA-1 que pode criar um rosto falante realista em tempo real a partir de uma imagem estática de uma pessoa e um arquivo de áudio existente. Esta ferramenta é capaz de gerar expressões faciais, movimentos de cabeça e movimentos labiais que correspondem ao discurso ou música. Os resultados obtidos até o momento são tão convincentes que podem enganar as pessoas, fazendo-as acreditar que são reais.
Apesar de os movimentos dos lábios e da cabeça nos exemplos fornecidos ainda parecerem um pouco robóticos e fora de sincronia após uma inspeção mais detalhada, é evidente que essa tecnologia poderá ser facilmente utilizada de forma irresponsável para criar vídeos falsos de pessoas reais. Os próprios pesquisadores estão cientes desse potencial e decidiram não disponibilizar a ferramenta publicamente até terem certeza de que será usada de forma responsável e conforme os regulamentos adequados. No entanto, não está claro se planejam implementar medidas de segurança para evitar o uso indevido da ferramenta.
Os pesquisadores acreditam que o VASA-1 possui muitos benefícios, apesar de seu potencial para uso malicioso. Eles afirmam que a tecnologia pode ser aplicada para melhorar a equidade educacional, aumentar a acessibilidade para pessoas com dificuldades de comunicação e até mesmo fornecer companhia e apoio terapêutico. Insinuam que a ferramenta poderia ser utilizada em programas que oferecem acesso a personagens de IA com os quais as pessoas podem interagir.
De acordo com o artigo publicado juntamente com o anúncio, o VASA-1 foi treinado com base no conjunto de dados VoxCeleb2, que contém mais de um milhão de declarações de 6.112 celebridades extraídas de vídeos do YouTube. Além de funcionar com rostos reais, a ferramenta também é capaz de atuar em fotos artísticas, como a Mona Lisa, que os pesquisadores combinaram de forma divertida com um arquivo de áudio da interpretação de Anne Hathaway da música “Paparazzi” de Lil Wayne. Mesmo que você tenha dúvidas sobre os benefícios dessa tecnologia, assistir a essas combinações pode ser uma experiência interessante.
Este artigo contém links afiliados; ao clicar em algum desses links e realizar uma compra, podemos receber uma comissão. Garantimos nossa transparência em relação a isso, e agradecemos o seu apoio.