A maioria das pessoas que têm um cachorro de estimação ou que gosta de animais certamente já desejou poder entender melhor o que eles “falam” através dos seus latidos. E, pelo visto, essa é uma possibilidade futura com o uso da inteligência artificial.
Acontece que pesquisadores da Universidade de Michigan, em colaboração com o Instituto Nacional de Astrofísica, Óptica e Eletrônica (INAOE) de Puebla, México, estão desenvolvendo ferramentas que podem identificar o que o cachorro quer “dizer” com cada tipo de latido, como por exemplo se é em estado de diversão ou até agressão, entre outras nuances.
Leia também:
12 funções “revolucionárias” do iOS 18 que já estão presentes nos Samsung Galaxy
Gmail e Docs agora contam com IA generativa para te ajudar a escrever
A IA como intermediária na comunicação animal
A nova pesquisa promete trazer mais informações a depender dos latidos, tanto em relação às intenções dos animais ou até mesmo detalhes como a idade, a raça e até mesmo o sexo. Para isso, eles usaram modelos de IA que eram usados antes para processamento de fala humana, só que nesse caso convertendo para a “fala canina”.
O estudo, apresentado na Conferência Internacional Conjunta sobre Linguística Computacional, Recursos de Linguagem e Avaliação, mostra que técnicas originalmente desenvolvidas para a fala humana podem ser reaproveitadas para entender a linguagem dos cães.
Rada Mihalcea, Professora Colegiada Janice M. Jenkins de Ciência da Computação e Engenharia e diretora do Laboratório de IA da U-M, destacou a importância dessa abordagem inovadora. “Usando modelos de processamento de fala inicialmente treinados em fala humana, nossa pesquisa abre uma nova janela para como podemos aproveitar o que já construímos no processamento de fala para começar a entender as nuances dos latidos dos cães,” disse Mihalcea. “Há tanto que ainda não sabemos sobre os animais que compartilham este mundo conosco. Avanços em IA podem ser usados para revolucionar nosso entendimento da comunicação animal, e nossos achados sugerem que talvez não precisemos começar do zero.”
Desafios na coleta de dados animais
Porém, um dos principais obstáculos na análise de vocalizações animais é a falta de dados publicamente disponíveis. Coletar dados de fala humana é relativamente fácil, mas registrar vocalizações de animais é um tanto mais complexo. “Vocalizações animais são logisticamente muito mais difíceis de solicitar e gravar,” explica Artem Abzaliev, autor principal e estudante de doutorado na U-M. “Elas devem ser gravadas passivamente na natureza ou, no caso de animais domésticos, com a permissão dos proprietários.”
Com isso, eles acabam ficando mais escassos de dados que podem ser utilizados para esse estudo, o que dificulta ainda mais o desenvolvimento de técnicas verdadeiramente eficazes para conseguir uma análise mais precisa das vocalizações dos cachorro, ou seja, um desafio.
Mas para tudo há uma solução. Nesse caso, os pesquisadores superaram essa barreira reutilizando um modelo existente de análise de fala humana, o Wav2Vec2, que foi ajustado para interpretar vocalizações caninas. Eles conseguiram então aproveitar alguns modelos interessantes que estão presentes em várias tecnologias de comando de voz usadas atualmente, e até mesmo para transcrição de voz para texto e traduções.
Acontece que esses modelos conseguem captar e distinguir nuances nas falas humanas, como o tom da voz, o sotaque, entre outros detalhes. Eles também conseguem transformar essas informações em um formato que permite que o computador identifique o que está sendo dito.
“Esses modelos são capazes de aprender e codificar os padrões incrivelmente complexos da linguagem e fala humanas,” disse Abzaliev. “Queríamos ver se poderíamos aproveitar essa habilidade para discernir e interpretar latidos de cães.”
Resultados promissores e aplicações futuras
Utilizando um conjunto de dados de vocalizações de 74 cães de diferentes raças, idades e sexos, os pesquisadores conseguiram modificar o Wav2Vec2 para gerar representações acústicas dos latidos.
Este modelo não apenas teve sucesso em quatro tarefas de classificação, mas também superou outros modelos específicos para dados de latidos de cães, com uma precisão de até 70%.
“Esta é a primeira vez que técnicas otimizadas para fala humana foram utilizadas para ajudar na decodificação da comunicação animal,” disse Mihalcea. “Nossos resultados mostram que os sons e padrões derivados da fala humana podem servir como base para analisar e entender os padrões acústicos de outros sons, como vocalizações de animais.”
Isso é bem interessante, uma vez que mostra que é possível estabelecer modelos de fala humana também como uma ferramenta para analisar a comunicação animal. Os benefícios podem ser inúmeros, até mesmo para biólogos e pessoas que estudam o comportamento desses animais. Além, claro, de poder ajudar a melhorar ainda mais o bem-estar desses animais, já que poderemos saber com mais precisão o que eles precisam. Ou seja, ao decifrar a linguagem canina, podemos abrir caminho para uma convivência mais harmoniosa e empática entre humanos e seus companheiros animais.
Fonte: Universidade de Michigan