NVIDIA enfrenta processo por uso de 500 TB de livros pirateados para treinar IA
UM NVIDIA enfrenta um processo judicial nos Estados Unidos após supostamente utilizar 500 terabytes de livros pirateados para treinar seus modelos de inteligência artificial. Segundo documentos anexados ao Tribunal Distrital do Norte da Califórnia, a gigante dos chips teria deliberadamente ignorado alertas sobre a ilegalidade do material obtido do site Anna’s Archive.
De acordo com as novas evidências apresentadas por um grupo de escritores, a NVIDIA não apenas buscou ativamente o conteúdo protegido por direitos autorais, como também negociou diretamente com os administradores da plataforma pirata para obter “acesso de alta velocidade” ao banco de dados. O objetivo seria alimentar o desenvolvimento de seus modelos proprietários, como o NeMo e Megatron.
Emails internos de 2023, obtidos durante a fase de coleta de provas, revelam que a decisão de utilizar o material ilegal teria partido da própria gerência da empresa. Os documentos indicam que a NVIDIA estava sob “pressão competitiva” para rivalizar com o ChatGPT da OpenAI, buscando acelerar o lançamento de seus próprios modelos de linguagem, identificados internamente como “NextLargeLLM”.

Um detalhe agravante na acusação é que os operadores do Anna’s Archive teriam explicitamente alertado a Nvidia sobre a natureza ilícita da coleção, questionando inclusive se a empresa possuía autorização interna para assumir tal risco legal. Mesmo assim, segundo o processo, a empresa “deu sinal verde” para prosseguir com o download do material pirata em menos de uma semana após o contato inicial.
Além do Anna’s Archive, a versão ampliada da queixa aponta que a NVIDIA teria recorrido a outras fontes notórias de pirataria acadêmica e literária, como Biblioteca, LibGen, Sci-Hub e Z-Library. O acervo utilizado incluiria milhões de livros que, legalmente, estariam disponíveis apenas em sistemas de empréstimo digital restritos.


Em sua defesa preliminar, a NVIDIA argumentou que a utilização de livros para treinamento de IA constituiria “uso justo” (uso justo), alegando que as obras servem apenas como base para correlações estatísticas em seus modelos. Os autores, por sua vez, ampliaram as acusações para incluir infração direta e vicária de direitos autorais.
O caso remete a uma disputa similar envolvendo a Anthropic, desenvolvedora da IA Claude, que também foi processada por usar obras protegidas em seus treinamentos. Embora a empresa tenha inicialmente obtido decisão favorável quanto ao uso de livros legalmente adquiridos, um acordo de US$ 1,5 bilhão (aproximadamente R$ 8 bilhões) foi firmado para encerrar a disputa relacionada às cópias pirateadas.
O processo contra a NVIDIA continua em andamento, com os escritores buscando compensação pelo uso não autorizado de suas obras na criação de tecnologias comerciais de inteligência artificial.
Você também pode gostar dos artigos abaixo:
Realidade brutal: NVIDIA fatura 12x mais com IA do que com placas de vídeo para gamers
NVIDIA enfrentará queda dramática de mercado na China com avanço de rivais locais, apontam analistas
Acesse agora a Loja Podicas no Mercado Livre e descubra produtos incríveis para o dia a dia.

