Empresas como a do ChatGPT deveriam pagar pelas fontes de dados usadas no treinamento? O Reddit acha que sim.
O Reddit vai cobrar o acesso à sua API de empresas que treinam grandes modelos de linguagem (LLMs) usados em inteligências artificiais como o ChatGPT. “Achamos justo”, disse Steve Huffman, cofundador e CEO do Reddit.
Desenvolvedores de aplicativos e robôs e pesquisadores continuarão tendo acesso gratuito à API do Reddit.
Atualização (10h39): Ao contrário do que noticiou o New York Times, a API também passará a ser cobrada de desenvolvedores. Pelo menos é o que diz Christian Selig, criador do Apollo: “O uso gratuito da API para aplicativos como o Apollo não é algo que eles [Reddit] vão oferecer, logo, eu oferecer o uso gratuito do app provavelmente será muito difícil. É quase certo que o Apollo terá que mudar para um modelo [em que exista] apenas Apollo Ultra (leia-se: assinatura paga).”
Huffman parece entender uma ou outra coisa melhor do negócio do que seu colega do Twitter, que quebrou a API gratuita e afugentou meio que todo mundo da plataforma.
Cabe aqui um exercício que extrapole a situação do Reddit a toda a web.
O Google e outros buscadores desde sempre vasculham e processam o conteúdo de sites, mas até então havia uma relação de troca: o Google e outros buscadores “pagavam” esse acesso mandando pessoas que buscam por coisas que os sites oferecem. É algo que funciona bem. No Manual, por exemplo, a maior parte dos acessos é originada no Google.
Com as IAs, como o ChatGPT, Google Bard e Bing Chat, essa troca deixa de existir porque elas devolvem a resposta na própria página do buscador, sem que a pessoa interessada precise visitar outro site — no caso, a fonte da informação. Os buscadores viram parasitas, e… bem, no fundo, os chatbots explicitam um problema que já vinha se desenhando, conforme estes dados de 2019.
Mesmo um site pequeno, como o Manual, pode oferecer um corpus de dados significativo. (Em quase dez anos, publicamos 4,3 mil posts e 111,1 mil comentários.) Se interfaces como a do ChatGPT realmente se firmarem na rotina das pessoas, ocupando o espaço antes dedicado às pesquisas na web, prevejo dias difíceis pela frente. Via New York Times (em inglês).