Como as gigantes de tecnologia dão um jeitinho para coletar dados para IA

7/4/2024, 13h02 1

O New York Times publicou uma reportagem bombástica mostrando como, nos bastidores, as grandes empresas de IA dão um jeitinho (às vezes ilegal) de obter conteúdo para treinar seus grandes modelos de linguagem, base das IAs generativas.

A parte mais engraçada é o Google fazendo vista grossa para a OpenAI raspando 1 milhão de horas (!) de vídeos do YouTube para transcrever e alimentar o GPT-4 porque o próprio Google estava fazendo o mesmo para o Gemini. (A prática viola os termos de uso do YouTube.)

Detalhe: dois dias antes, o CEO do YouTube, Neal Mohan, disse à Bloomberg (sem paywall) que o uso de vídeos pela OpenAI para treinar a Sora seria contra as diretrizes da plataforma.

Como as gigantes de tecnologia dão um jeitinho para coletar dados para IA (sem paywall)
New York Times

1 comentário

Léo B. disse:

7/4/2024 às 14h25

“All your base are belong to us” + “too big to jail”

Escolhas do editor

Posts aleatórios

É impossível avaliar o sono com apenas um número 2/10/2025
Visual do Pebble Time 2 13/8/2025
Novos descontos no clube: Pika e Letterbird, do estúdio Good Enough 16/1/2026
apt 3.0.0 9/4/2025
Torta de climão na festa dos 50 anos da Microsoft. Duas funcionárias interromperam… 4/4/2025