O acordo entre pessoas e empresas da chamada web 2.0 já não era dos melhores: em troca de espaço para publicar na internet, conexão e alcance, cedemos nossos dados mais íntimos para que elas lucrassem horrores direcionado anúncios invasivos.
A explosão da inteligência artificial gerativa, liberada pela OpenAI e seu grande sugador de dados da internet, piorou os termos para o nosso lado.
De maneira unilateral, as big techs que veiculam conteúdo gerado pelos usuários alteraram seus termos de uso, garantido a elas o direito de usar os nossos dados para treinar IAs.
Google, Meta e, em breve, X (antigo Twitter). Não houve grandes anúncios nem nada do tipo. Coube à imprensa e aos ativistas pró-privacidade jogar luz nessas alterações faustianas.
A Meta disponibilizou um formulário que (supostamente) permite às pessoas excluírem dados pessoais de fontes/conjuntos de terceiros obtidas ou comprados pela empresa para treinar IAs.
Note a engenhosidade do texto: em momento algum a Meta diz que os dados em suas plataformas abertas (Facebook e Instagram) estão no pacote. Você usa Facebook? Instagram? Parabéns, você está treinando as IAs da Meta.
Esse “trabalho forçado” invisível não é novidade. Há mais de uma década, o Google treina seus algoritmos de computação visual com CAPTCHAs — aqueles desafios que nos pedem para identificar pontes, faixas de pedestres e carros em pequenas imagens borradas.
Quando muito, essas empresas pagam uma mixaria a trabalhadores precarizados em países do Sul Global.
A diferença desta nova fase de exploração generalizada com a IA gerativa, é a (falta de) transparência, abrangência e escala.
Até então, as big techs “apenas“ lucravam com os nossos dados. Agora elas querem mais que isso; querem nos usar para criar novos produtos que, depois, pagaremos para usar.
Se eu pudesse ao menos receber uns trocados , com o mesmo pagamento por conteúdo gerado por usuario, ou seja, uns centavos de dólar mas que convertendo pra Real ia ao menos dar para comprar umas cervejas…
Mas nao, eh trabalho voluntario pro capital privado, vou voltar a escrever no diário de papel mesmo, talvez umas cartas e postais pelo correio…
A partir do momento em que você não paga pelo serviço, você é o produto.
… e quando você paga eu ganho nos 2!
– Microsoft.
Eu bloqueio todo o possível do rastreamento do Windows. E também nunca gastei um centavo com o sistema.
Vão treinar com os documentos privados no google drive também ou só com os públicos + youtube? Quando essas mudanças entram em vigor?
Os termos de uso do Google falam em “publicly available information”, ou seja, só o que é acessível publicamente. Arquivos e vídeos privados não devem entrar.
Essas mudanças já estão valendo desde julho.
Que bom, é um pouco menos pior… Espero que respeitem os próprios termos. Mas é triste demais pra gente que trabalha com imagem ou texto :/
O fato de deixar a vida publica descrita online faz que maquinas leem sua vida publica descrita online??
Oh, o horror. Quem poderia imaginar!!!
E no final de tudo isso vai mudar tudo para nós. Se eu contasse cada vez que o Bezos me liga porque eu tenho conta da Amazon, ou que um funcionário indiano do google bate na porta da minha casa… são afinal mais de 10 anos que eles sabem tudo de min, portanto o que passo hoje é inevitável.
Péra…
Eu posso não estar conseguindo entender direito, mas, eu não me lembro do EULA de todas essas empresas i) valer pro Brasil (uma vez que elas não tem um contrato de uso/licença para cada país e “elegem” a jurisprudência local para litigios não cobertos no EULA original) e ii) de ter uma clausula sobre uso de dados para geradores de texto/treino de IAs.
Cara isso não é sensato!
Se eu posto publicamente algo eu tenho de esperar que seja aberto publicamente. E, ao berrar na rua minha opinião, caso alguém esteja nessa rua gravando tudo ele gravou o que eu berrei!
Em parte – apenas em parte – eu até concordaria que se o google treinar usa IA com meu gmail, informações privadas (e com detalhes pessoas removidos e blablabla) eles estariam errado.
Agora… olhe acima. Vou te processar por saber meu nome? Deletar os cookies do teu PC?
O errado (insano) é a expectativa que tudo que eu coloco aberto na internet não seja aberto!
Teoricamente, o contrato não previa isso (até porque não existia esse tipo de IA quando essas plataformas foram lançadas), então qualquer uso por IA precisa ser reafirmado no EULA.
Disso sairiam, no meu ver, duas situações: i) eu deleto a minha conta e tudo que tem nela e impeço o uso para treinamento de IA e ii) eu aceito esse uso e mantenho minha conta.
Ou o meio termo: manter a conta e usar os dados para treinar IAs desde que esses sejam anônimos.
~~~
Em tese, a rua é via pública de livre acesso. Esse exemplo não parece ser o melhor porque eu não preciso me identificar pra andar na rua, eu não preciso de um cadastro pra andar na rua, as pessoas não coletam meus dados pessoais (nome, peso, altura, doenças, buscas) por andar na rua, etc. No máximo, e isso já é discutido atualmente, o Estado e algumas empresas de segurança pegarão minha imagem via camêras de segurança.
Mas, mantendo o exemplo, seria mais como se a pessoa pegasse a sua voz, captada por esse “berro” e lançasse você como um músico, angariando milhões com a sua voz e gerando novas receitas (e novas palavras que você não disse com o berro).
Como eu disse, esse exemplo é bem ruim porque as plataformas são proprietárias e exigem a assinatura de EULA pra que você as use. Nada mais justo que, em caso de mudança do EULA, elas avisem, dando a opção de continuar ou não na plataforma etc.
qualquer uso por IA precisa ser reafirmado no EULA.
Verdade. Se já não foi. Parte dos span que recebo é “mudamos a EULA” de algum serviço que eu não ligo que nem lembro que tenho.
Concordo que é necessário mas isso é trivial e facilmente irrelevante para mais de 99% dos usuários, no formato de “mudanos e deu, se não gosta delete sua conta aqui”.
Agora o “escândalo” não faz sentido. Se a informação está aberta na internet, ela está aberta na internet.
Amanha quando chegarem os aliens, ou a skynet, vamos processar o facebook por ter deixado nossa informação aberta exatamente como queríamos ao postar? Tenhamos o mínimo de responsabilidade, de bom senso. O google não pode fazer isso com o meu gmail privado (salvo uma eula bem escrita), mas o que é público é público, e exatamente agora tem gente lendo e copiando >como sempre teve<.
E verdade, se não gosta deleta a conta.
Sua lógica parte do pressuposto de que só por estar acessível publicamente, o material é de todo mundo e de qualquer um. E, goste ou não, não é assim que funciona.
Tome o Manual como exemplo. Se você rolar a página, encontrará a licença do conteúdo daqui: CC BY-NC-SA 4.0. Essa sopa de letrinhas significa que o conteúdo publicado no domínio
manualdousuario.net
pode ser replicado, desde que mantido o crédito, sem fim comercial e que a obra derivada seja disponibilizada sob a mesma licença.O Google e a OpenAI coletaram meu conteúdo sem dar atribuição, para fins comerciais e redistribuído com outra licença. Sem entrar no mérito da moralidade ou do que é “certo” ou “errado”; o que essas empresas fazem é pura e simplesmente ilegal.
O famoso pacto CaraCu