A próxima parte crucial do nosso plano é aprender com os dados únicos e loops de feedback em nossos produtos… No Facebook e no Instagram, há centenas de bilhões de imagens compartilhadas publicamente e dezenas de bilhões de vídeos públicos, o que estimamos ser maior do que o conjunto de dados Common Crawl, e as pessoas também compartilham um grande número de postagens de texto público em comentários em nossos serviços.

Mark Zuckerberg
CEO da Meta

Common Crawl é o maior conjunto de dados da web disponível, com +250 bilhões de páginas coletadas no intervalo de 17 anos. Foi usado pela OpenAI na criação do GPT 3.

É nas conferências com investidores, e não em depoimentos no Congresso, que os CEOs falam sem muitas amarras do que realmente importa. Não poderia ter exemplo melhor disso do que as falas de Zuckerberg um dia depois de pedir desculpas às famílias de adolescentes vítimas de abusos no Instagram (e só depois de ser coagido por um senador). Via Bloomberg (em inglês).

A newsletter do Manual. Gratuita. Cancele quando quiser:

Quais edições extras deseja receber?


Siga no Bluesky, Mastodon e Telegram. Inscreva-se nas notificações push e no Feed RSS.

1 comentário

  1. isso nao eh tao ruim ja q a maior parte senao tudo q eh postado nessas redes sao coisas mediocres sobre vidas mediocres.