Início CIÊNCIA A corrida para traduzir sons de animais para a linguagem humana

A corrida para traduzir sons de animais para a linguagem humana

15
0

Em 2025 veremos a IA e a aprendizagem automática aproveitadas para fazer progressos reais na compreensão da comunicação animal, respondendo a uma pergunta que intriga os humanos desde que existimos: “O que os animais dizem uns aos outros?” O recente Prêmio Coller-Dolittleoferecer prémios em dinheiro até meio milhão de dólares aos cientistas que “decifrarem o código” é uma indicação de uma confiança otimista de que os recentes desenvolvimentos tecnológicos na aprendizagem automática e nos grandes modelos de linguagem (LLMs) estão a colocar este objetivo ao nosso alcance.

Muitos grupos de pesquisa trabalham há anos em algoritmos para dar sentido aos sons dos animais. O Projeto Ceti, por exemplo, tem decodificado os cliques dos cachalotes e o canto das jubartes. Essas ferramentas modernas de aprendizado de máquina exigem quantidades extremamente grandes de dados e, até agora, faltavam essas quantidades de dados de alta qualidade e bem anotados.

Considere LLMs como o ChatGPT, que possuem dados de treinamento disponíveis que incluem todo o texto disponível na Web. Essas informações sobre a comunicação animal não estavam acessíveis no passado. Não é apenas que os corpora de dados humanos sejam muitas ordens de magnitude maiores do que o tipo de dados aos quais temos acesso para animais na natureza: mais de 500 GB de palavras foram usadas para treinar o GPT-3, em comparação com pouco mais de 8.000 “codas ”(ou vocalizações) para a análise recente do Projeto Ceti sobre a comunicação dos cachalotes.

Além disso, ao trabalhar com a linguagem humana, já saber o que está sendo dito. Sabemos até o que constitui uma “palavra”, o que é uma enorme vantagem em relação à interpretação da comunicação animal, onde os cientistas raramente sabem se um determinado uivo de lobo, por exemplo, significa algo diferente de outro uivo de lobo, ou mesmo se os lobos consideram um uivo como de alguma forma análogo a uma “palavra” na linguagem humana.

No entanto, 2025 trará novos avanços, tanto na quantidade de dados de comunicação animal disponíveis aos cientistas, como nos tipos e no poder dos algoritmos de IA que podem ser aplicados a esses dados. A gravação automatizada de sons de animais foi colocada ao alcance de todos os grupos de pesquisa científica, com dispositivos de gravação de baixo custo, como o AudioMoth, explodindo em popularidade.

Enormes conjuntos de dados estão agora a ficar on-line, uma vez que os gravadores podem ser deixados no campo, ouvindo os cantos dos gibões na selva ou dos pássaros na floresta, 24 horas por dia, 7 dias por semana, durante longos períodos de tempo. Houve ocasiões em que esses enormes conjuntos de dados eram impossíveis de gerenciar manualmente. Agora, novos algoritmos de detecção automática baseados em redes neurais convolucionais podem percorrer milhares de horas de gravações, selecionando os sons dos animais e agrupando-os em diferentes tipos, de acordo com as suas características acústicas naturais.

Assim que esses grandes conjuntos de dados de animais estiverem disponíveis, novos algoritmos analíticos tornam-se uma possibilidade, como o uso de redes neurais profundas para encontrar estruturas ocultas em sequências de vocalizações de animais, que podem ser análogas à estrutura significativa na linguagem humana.

No entanto, a questão elementary que permanece obscura é: o que exatamente esperamos fazer com estes sons de animais? Algumas organizações, como a Interspecies.io, definem o seu objectivo de forma bastante clara como “transduzir sinais de uma espécie em sinais coerentes para outra”. Em outras palavras, para traduzir comunicação animal para a linguagem humana. No entanto, a maioria dos cientistas concorda que os animais não humanos não possuem uma linguagem própria – pelo menos não da mesma forma que nós, humanos, temos a linguagem.

O Prêmio Coller Dolittle é um pouco mais sofisticado, buscando uma forma de “comunicar ou decifrar a comunicação de um organismo”. Decifrar é um objetivo um pouco menos ambicioso do que traduzir, considerando a possibilidade de os animais não terem, de fato, uma linguagem que possa ser traduzida. Hoje não sabemos quanta informação, ou quão pouca, os animais transmitem entre si. Em 2025, a humanidade terá o potencial de ultrapassar a nossa compreensão não apenas do quanto os animais dizem, mas também do que exatamente eles dizem uns aos outros.

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui