Meta baixou 81 TB de livros ilegalmente via torrent para treinar sua IA

A Meta baixou 81 TB de livros piratas para treinar sua IA, levantando questões sobre direitos autorais e ética no uso de dados.

Por Felipe Alencar
, em 7 fevereiro de 2025 às 15:06

Hard News Tecnologia

A Meta, empresa responsável por plataformas como Facebook, Instagram e WhatsApp, está no centro de uma nova polêmica envolvendo direitos autorais. Documentos judiciais recentemente divulgados revelam que a companhia baixou ilegalmente mais de 81 TB de livros piratas para treinar seus modelos de inteligência artificial, utilizando fontes ilícitas como o LibGen e o Anna’s Archive.

A prática foi exposta durante um processo nos Estados Unidos, no qual artistas e escritores acusam a empresa de utilizar obras sem permissão ou compensação financeira. Além da violação de direitos autorais, os arquivos indicam que a Meta empregou o método torrent, o que pode ter resultado na redistribuição involuntária dos materiais baixados para outros usuários.

Abra em outra aba e leia na sequência:

O que é torrent e como funciona?

Funcionários sabiam da ilegalidade, aponta troca de e-mails

Um dos aspectos mais comprometedores do caso são as mensagens internas da Meta, que demonstram que seus funcionários — incluindo altos executivos — estavam cientes da ilegalidade da ação. Em um e-mail de abril de 2023, o pesquisador Nikolay Bashlykov escreveu: “Baixar torrent de um laptop corporativo não parece certo”, acrescentando um emoji sorridente.

Já em setembro de 2023, Bashlykov alertou diretamente o departamento jurídico da empresa, destacando que o uso de torrents implicaria na redistribuição do conteúdo, o que “poderia ser ilegal”. No entanto, em vez de interromper a prática, a Meta teria tentado ocultar os downloads, utilizando VPNs e servidores externos para mascarar a origem dos acessos.

Outro e-mail menciona que a decisão de utilizar bases de dados como o LibGen teria sido tomada após escalar a questão para Mark Zuckerberg (MZ), sugerindo que o CEO da empresa tinha ciência do processo, em contradição com declarações anteriores.

Defesa da Meta se fragiliza diante das novas provas

Inicialmente, a Meta justificou o uso de livros piratas para treinar seus modelos de IA sob o argumento de “fair use” (uso justo), uma cláusula da legislação de direitos autorais dos EUA que permite o uso limitado de materiais protegidos para fins educacionais, jornalísticos ou de pesquisa. No entanto, o volume massivo de dados obtidos ilegalmente e a tentativa de ocultação podem enfraquecer essa defesa no tribunal.

Além disso, as novas evidências impulsionaram os autores do processo a exigirem novos depoimentos de funcionários da Meta, pois os documentos divulgados parecem contradizer declarações anteriores feitas pela empresa.

O caso se torna ainda mais complexo com a demissão do advogado Mark Lemley, que inicialmente defendia a Meta. Segundo informações, sua saída está relacionada a mudanças estratégicas da empresa para se alinhar a uma política mais favorável ao ex-presidente dos EUA, Donald Trump, o que gerou instabilidade interna.

A crescente dependência de grandes empresas de tecnologia por vastos conjuntos de dados para treinar modelos de IA levanta questões críticas sobre ética, direitos autorais e regulamentação do setor. Se a Meta for considerada culpada, a decisão pode abrir um precedente para ações judiciais contra outras gigantes da tecnologia, como OpenAI e Google, que também enfrentam acusações semelhantes.

Diante desse cenário, a questão que fica é: a busca por inovação justifica a violação de direitos autorais ou as leis precisam ser reforçadas para impedir abusos? Deixe sua opinião nos comentários!

Fonte: Ars Technica

Tags: IA generativa, Inteligência Artificial, Meta

Postado por

Felipe Alencar

Cearense. 37 anos. Apaixonado por tecnologia desde que usou um computador pela primeira vez, em um hoje jurássico Windows 95. Além de tech, também curto filmes, séries e jogos.

Siga em: