30 anos de Debian

São raros os softwares com o “ethos”, o histórico e a influência do Debian, a segunda distribuição (distro) Linux mais antiga ainda ativa.

Nesta quarta (16), completou-se 30 anos do seminal e-mail que o saudoso Ian Murdock enviou a uma lista de discussões anunciando a criação do “Debian Linux Release”.

(mais…)

Novidades no Órbita e alterações nos perfis de usuários

Nas últimas duas semanas, o Órbita, nosso plugin de código aberto que cria um espaço para conversas no site, ganhou algumas atualizações importantes, fruto do trabalho do Renan Altendorf:

  • Redirecionamento automático ao publicar uma conversa ou link. Antes, por uma limitação técnica, havia uma tela entre a do formulário de publicação e a do post em si. Essa tela foi removida.
  • Links para vídeos do Dailymotion, Vimeo e YouTube agora puxam o player do respectivo site direto para o post no Órbita.
  • Ícones/emojis informativos (💬 para conversas, 🔒 para comentários fechados) foram trazidos para o início do post. O do cadeado, antes inserido manualmente, agora é automático.
  • Correção de URLs com parâmetros em links externos. Antes, o ? do primeiro parâmetro se repetia nos acrescidos pelo Órbita. Agora o plugin identifica se já existe um ? na URL e, em caso positivo, acrescenta os do Órbita iniciando com um &. (Isso é meio técnico; na prática, URLs com parâmetros não quebram mais quando publicadas no Órbita.)
  • Havia uma pequena falha na validação da existência do(a) usuário(a) que estava gerando erros nos logs do WordPress devido a contas excluídas. Foi adicionada uma verificação que eliminou esses erros.
  • Ainda em testes, foram adicionados “capabilities” específicas para o Órbita no WordPress. Na prática, isso permitirá a criação de “cargos” de moderador e, talvez, até a edição de comentários e posts pelos próprios usuários.

Aproveitei o embalo para fazer algumas mudanças e melhorias para pessoas cadastradas no site/Órbita:

  • Removi o campo de envio do avatar. Havia dois possíveis, o interno (que foi removido) e o ligado ao Gravatar. Ficou só o último. Para adotar ou alterar seu avatar, crie uma conta no Gravatar e cadastre o e-mail que você usa para comentar aqui (ou que está em seu cadastro no site).
  • Agora, ao logar, aparece um link no menu principal que leva à edição do perfil. É possível alterar nome de exibição, e-mail e outros detalhes.
  • Para evitar ruído e preservar a privacidade dos demais leitores/usuários, editei o painel administrativo do WordPress (com o plugin Adminimize) para remover áreas em que informações pessoais ficavam expostas. Agora, quando alguém edita o perfil no painel do WordPress, só consegue ver isso, o próprio perfil.

Reconhecimento facial na mira da China

por Shūmiàn 书面

A Administração do Ciberespaço da China, órgão que regulamenta a internet no país, abriu para consulta pública o rascunho de regras para restringir o uso de tecnologia de reconhecimento facial em território nacional.

Com 25 artigos, a proposta proibiria o uso dessa tecnologia como forma de verificação de identidade em bancos, hotéis, aeroportos, bibliotecas e estabelecimentos comerciais, a não ser que seja exigido por lei — e, nesse caso, sistemas nacionais de reconhecimento facial devem ser utilizados.

Como explica Evelyn Cheng para a CNBC, o reconhecimento facial pode ser usado atualmente para realizar pagamentos em algumas lojas, estações de metrô e para entrar em prédios e campi universitários.

As regras propostas também estabelecem que essa tecnologia somente deve ser usada quando outros métodos de verificação de identidade não-biométricos não forem suficientes e que é necessário obter consentimento e declaração de fim específico do uso dos dados coletados. Chama atenção o artigo 11, que preconiza que nenhuma organização ou indivíduo pode usar a tecnologia de reconhecimento facial para obter dados relacionados a raça, etnia, religião, classe social e demais dados sensíveis. A consulta pública está aberta até sete de setembro e o rascunho da proposta pode ser lido aqui (em chinês). Uma tradução para o inglês foi disponibilizada pelo China Law Translate.

OpenAI ensina a barrar robô sugador de sites do ChatGPT depois de sugar todos os sites

Na melhor tradição do Vale do Silício de pedir desculpas em vez de por favor, no início de agosto a OpenAI disponibilizou um documento ensinando a barrar o robô deles de acessar um site.

Ótimo, mas só agora? Depois de a empresa sugar toda a web para treinar seus grandes modelos de linguagem (todas as versões do GPT)?

Inteligências artificiais gerativas, como o ChatGPT, são, em essência, imitadores descerebrados daquilo que seus donos enfiaram no modelo. Você reúne e processa uma tonelada de conteúdo (em geral, alheio) e o robô vomita frases que aparentam (e, com frequência, fazem) sentido, ainda que incorretas ou fantasiosas.

Quem tem sites não ficou muito contente de ver seu material apropriado por uma empresa com fins lucrativos e ambições megalomaníacas, cujo objetivo é, entre outros, substituir esses mesmos sites por chatbots.

Em alguns sites muito grandes, como Reddit e Twitter, digo, X, o sucesso avassalador do ChatGPT juntou-se à ganância de executivos para servir de bode expiatório à tomada de decisões hostis aos usuários, como fechar APIs públicas e destruir aplicativos de terceiros.

A OpenAI, mais uma vez, muda de postura no momento em que tem a dianteira de uma questão sensível à concorrência do setor de IA — a mesma estratégia do seu lobby em regulação.

No documento, a empresa diz que seu “crawler” (o tipo de robô aspirador de conteúdo alheio) já filtra páginas que contêm informações pessoais identificáveis, como se isso fosse trivial ou garantido. Diz, ainda, que “permitir que o GPTBot acesse seu site pode ajudar os modelos de IA a se tornarem mais precisos e melhorar suas capacidades gerais e segurança”. Ótimo, mas para quem?

Para bloquear o crawler da OpenAI, inclua essas linhas no arquivo robots.txt na raiz do domínio:

User-agent: GPTBot
Disallow: /

Se a OpenAI vai respeitar isso? Impossível saber. Quem tem dinheiro e mais coisas em jogo não confia na benevolência de Sam Altman e companhia e, em vez disso, convocou uma legião de advogados para levar a discussão à Justiça.

É o caso do maior jornal do mundo, o norte-americano New York Times, que cogita processar a OpenAI.

Certos problemas ainda se resolvem melhor com os bons, velhos e falhos seres humanos.

Enxurrada de pedidos “inócuos” em ações contra a Meta leva juiz a pedir para que parem de tumultuar

O juiz da 29ª Vara Cível de Belo Horizonte, José Maurício Cantarino Villela, proferiu uma decisão (íntegra) nas ações coletivas que o Instituto Defesa Coletiva moveu contra a Meta implorando às pessoas para quem parem de protocolar pedidos para participarem das ações.

São quelas em que o mesmo juiz sentenciou a Meta a indenizar em R$ 5 mil todo brasileiro que tivesse conta no Facebook e/ou WhatsApp entre 2018 e 2019.

A notícia, divulgada com pouco cuidado por diversos veículos de comunicação, gerou uma enxurrada de pedidos inadequados de “habilitação” nas ações em curso.

Em texto destacado, o juiz Villela indeferiu todos esses pedidos e fez ele próprio um:

Recomendamos, também, que cesse a apresentação de requerimentos de “habilitação” nos autos da ACPCiv no 5064103-55.2019.8.13.0024 e da ACPCiv no 5127283-45.2019.8.13.0024, visto que essas peças processuais, além de causarem tumulto e dificultarem o trâmite processual, são inócuas para se alcançar a finalidade pretendida pelos peticionantes.

Ele também indeferiu “os futuros requerimentos que venham a ser apresentados nas mesmas condições”.

Essas petições, segundo o juiz, “têm sido contraproducentes, bem como comprometem a prestação do serviço judicial de forma célere e efetiva”.

O caminho correto, em casos como esse, é o de apresentar uma execução independente das ações coletivas originárias, em qualquer comarca do Brasil. Nela, o exequente deverá comprovar que tinha conta no Facebook/WhatsApp à época dos vazamentos que são objeto da ação.

O prazo prescricional para execuções do tipo é de cinco anos a partir do trânsito em julgado, ou seja, tem tempo de sobra, visto que as ações coletivas sequer chegaram nessa fase.

Ainda, na mesma peça os interessados pessoas físicas são orientados a aguardar o trânsito em julgado (o fim das possibilidades de recurso) porque, caso a sentença seja reformada (alterada) em instâncias superiores, o(a) beneficiário(a) pode ser obrigado a devolver a indenização.

Relembrando, o entendimento corrente do Superior Tribunal de Justiça (STJ) é de que danos morais decorrentes do vazamento de dados pessoais não são presumidos, ou seja, a pessoa que quiser pleitear a indenização teria que provar que o vazamento lhe causou algum transtorno.

Alguns advogados têm orientado interessados na indenização de que o artigo 42, § 2º da Lei Geral de Proteção de Dados embasaria a indenização pelo dano moral individual presumido, ou seja, sem a necessidade de demonstrar prejuízo efetivo pelo vazamento de dados, cabendo à Meta provar que não houve.

Ainda que esse entendimento não seja descartável de pronto, a discussão no processo de execução é nova, e caberá ao juízo de cada ação nova interpretar a situação. Como baliza, deverão usar o entendimento vigente do STJ, que, como demonstrei aqui, é o de que não se presume dano moral individual por vazamento de dados pessoais não classificados como sensíveis (art. 5º, II, da LGPD).

Por fim, é bastante atípico — para não dizer incorreto — fixar o valor do dano moral individual numa ação coletiva. Afinal, a intensidade do dano sofrido varia de pessoa para pessoa.

O próximo passo para o Telegram é ir além das mensagens e liderar a inovação nas mídias sociais em geral. Usaremos a nossa popularidade para mudar a vida de bilhões para melhor, para inspirar e elevar as pessoas em nosso planeta.

— Pavel Durov, CEO do Telegram.

O mesmo Telegram que deseja “liderar a inovação” em redes sociais lançou em julho, depois de todo mundo e quase dez anos após o pioneiro no formato, suporte a stories.

Nesta segunda (14), o Telegram completou dez anos no ar. Tem 800 milhões de usuários e já é, há muito, um híbrido de mensagens (sem criptografia de ponta a ponta padrão) e rede social (com moderação frouxa e sem regras de convivência robustas). Via @durov/Telegram (em inglês).

Deus Google agora exige sacrifícios “em nome do SEO”

SEO, o conjunto de técnicas de otimização para sites aparecerem melhor nos resultados de busca do Google, é uma espécie de religião de marqueteiros e tecnocratas.

O deus Google escreve suas linhas tortas, com dicas etéreas ou banais e orientações turvas, que são interpretadas pelos pastores — os ditos “especialistas em SEO” — e aplicadas nos sites dos fiéis, na esperança de que isso se reverta em bênçãos na forma de bons posicionamentos nos índices do buscador.

É um exercício de fé, porque ninguém consegue apontar, com rigor metodológico, a relação de causa e efeito entre SEO e resultados.

Os que creem seguem os preceitos religiosos do Google e apenas acreditam. Se funcionarem, é a prova definitiva de que SEO existe. Se não, o problema é comigo, que escrevi 490 palavras em vez de 500 e repeti a palavra-chave quatro vezes em vez de cinco; que não acreditei o bastante.

O paralelo ficou ainda mais forte na última quarta (9), quando o Gizmodo obteve um comunicado interno da Cnet em que a direção avisava os funcionários que estava apagando milhares de posts antigos para “melhorar o SEO”. A notícia foi confirmada à publicação por um diretor de marketing da Cnet.

Agora, deus Google passou a exigir sacrifícios como condição para despejar sua bondade sobre sites caça-cliques.

A lógica, segundo o comunicado interno, é de que excluir conteúdo antigo que não gera tráfego “envia um sinal ao Google que diz que a Cnet é atual, relevante e digna de ser posicionada acima dos nossos concorrentes nos resultados de pesquisa”.

Nas redes, o Google refutou a estratégia. O que não quer dizer muita coisa, porque o Google não revela o algoritmo de rankeamento do seu buscador e, suspeita-se, sequer o entende por completo. Por isso, não dá para descartar que, mesmo que o Google desaconselhe a prática, sob condições específicas ela possa surtir resultado positivo.

A Cnet, importante lembrar, foi flagrada no início de 2023 publicando textos escritos pelo ChatGPT com erros crassos, apenas para atrair incautos no Google dispostos a clicar em lucrativos anúncios de empréstimos financeiros e cartões de crédito.

A priorização do SEO é o famigerado rabo que abana o cachorro. Mirar boas posições no buscador do Google não deveria, em hipótese alguma, se sobrepor a decisões editoriais, quiçá justificar a destruição do arquivo de publicações (que se dizem) jornalísticas.

No entanto, é o acontece quando a teocracia do SEO, liderada pelo Google, toma de assalto a web. Fundamentalismo tecnológico, robôs acima de seres humanos, pessoas reduzidas a cliques em anúncios.

Simulador de Sabadaço e outros links legais

Um adolescente de 15 anos criou o Paxo (em francês), um celular funcional, de código aberto e feito em impressora 3D que custa € 30 (~R$ 160).

(mais…)

Entrando no Matrix

Enquanto a Europa tenta obrigar algumas das maiores empresas do mundo a tornarem seus aplicativos de mensagens interoperáveis para bilhões de pessoas, uma turma reduzida já vive no futuro.

Eles usam o Matrix, um protocolo de troca de mensagens em tempo real, descentralizado, de código aberto e com criptografia de ponta a ponta.

(mais…)

O Libreddit, “casca” alternativa para acessar o Reddit com mais privacidade e velocidade, foi descontinuado no PC do Manual, nosso servidor de aplicações web de código aberto.

Outras instâncias têm sofrido com as mesmas instabilidades que estávamos enfrentando, todas elas decorrentes de limitações artificiais impostas pelo Reddit.

Jojo já havia avisado do problema, e eu mesmo passei a topar com erros no Libreddit. Nos últimos dias, ele estava mais fora do ar do que de pé, aí tomamos a decisão de puxar o fio da tomada.

Desculpem o transtorno. Seguimos com Nitter, Miniflux e, em breve (já está em testes), Linkding (conheça o projeto).

China quer limitar o uso de internet por menores

por Shūmiàn 书面

Depois dos jogos de videogame, chegou a hora de o Partido Comunista Chinês (PCCh) lançar diretrizes para o controle do uso de celulares e da internet por menores de idade no país.

O pacote de diretrizes foi lançado na última quarta (2) e foi cuidadosamente detalhado pelo China Law Translate.

Será necessário logar no modo “menor” ou “maior” quando cada usuário acessa os dispositivos móveis, e cada modo tem restrições distintas, semelhante ao que acontece com alguns canais de streaming, por exemplo.

A legislação visa controlar o conteúdo e também o tempo que cada menor de idade passa na internet. A Bloomberg publicou uma reportagem [sem paywall] sobre como isso deve impactar os negócios de empresas como a Tencent e a ByteDance.

A Amazon fez um barulhão esta semana, com direito a evento presencial em São Paulo, para lançar seu cartão de crédito. Ele dá “cashback” em pontos que só podem ser gastos na própria Amazon e parcelamento a perder de vista. O que me chamou a atenção foi a cobertura da imprensa. Não me recordo de outro cartão de loja (convenhamos, é disso que se trata) que tenha atraído tanto a atenção dos colegas.

Claro estreou “5G fixo” no Brasil cobrando por franquia em vez de velocidade

A Claro lançou o primeiro plano do Brasil de internet fixa por 5G — no jargão técnico, Fixed Wireless Access (FWA). Ele também funciona em redes 4G.

A operadora optou por comercializar o serviço cobrando por franquia, método comum em planos de celulares/móveis, em vez da velocidade de conexão, padrão para banda larga fixa.

São dois planos, um com franquia de 200 GB (R$ 199,90/mês) e outro de 400 GB (R$ 399,90/mês). O consumidor interessado precisa adquirir o modem, um modelo da Intelbrás compatível com Wi-Fi 6, por preços que variam de R$ 799 a R$ 1.199, a depender do plano escolhido e fidelidade.

Direcionado a consumidores que têm dificuldades com cabeamento das conexões de fibra e para quem quer alguma mobilidade, o FWA da Claro está disponível, inicialmente, nas cidades de São Paulo, Campinas, Rio de Janeiro, Porto Alegre e Brasília.

O Teletime apurou que o FWA é enquadrado como Serviço Móvel Pessoal, portanto sujeito às mesmas regras do serviço de internet móvel.

Por isso, o lançamento da Claro escapa da cautelar que a Anatel publicou em 2016, quando as grandes operadoras do Brasil se atiçaram para cobrar franquia em conexões fixas.

Aquela cautelar, que não proíbe, mas impõe empecilhos enormes à cobrança por franquia nas conexões fixas, segue valendo.

A natureza do FWA pode gerar dúvidas, argumenta a publicação especializada. Afinal, é um “serviço móvel”, mas de uso estacionário.

Em entrevista ao Mobile Time, Marcio Carvalho, CMO da Claro, disse que a opção pela cobrança de franquias se deve ao compartilhamento do FWA com celulares, “que se mexem e trocam de uma célula para outra”, o que dificulta “cravar uma velocidade nesse ambiente”.

A Claro, com frequência, é apontada como detentora do 5G mais rápido do país.

Para o executivo, o modelo de cobrança não é o maior problema, mas sim o preço do modem. Será…?

Zoom tenta explicar suposto uso de videochamadas para treinar IA

Uma atualização de março de 2023 nos termos de uso do Zoom, popular aplicativo de videochamadas, colocou a empresa na defensiva nesta segunda (7).

Alguns sites acusaram o Zoom de estar usando dados dos usuários para treinar modelos de inteligência artificial, sem dar a chance de rejeitar a cessão de dados para essa finalidade.

É verdade, mas uma verdade menos maquiavélica do que algumas manchetes levam a crer.

A celeuma está centrada em duas cláusulas:

  • A cláusula 10.2, que prevê que o Zoom pode usar “dados gerados por serviços” para, entre outras coisas, “aprendizado de máquina ou inteligência artificial (inclusive para fins de treinamento e ajuste de algoritmos e modelos)”.
  • E a cláusula 10.4, que prevê que o usuário do Zoom concede uma licença ao Zoom que pode usar seu conteúdo (aí sim: videochamadas, arquivos e mensagens de texto) para, entre outras coisas, “fins de desenvolvimento de produtos e serviços […] aprendizado de máquina, inteligência artificial, treinamento […]”.

“Dados gerados por serviços”, os que são usados de maneira compulsória, são “quaisquer dados de telemetria, dados de uso do produto, dados de diagnóstico e conteúdo ou dados semelhantes”.

Em outras palavras, nada relacionado ao conteúdo do usuário — videochamadas, arquivos ou mensagens de texto —, apenas metadados que, regra geral, empresas comerciais e até algumas não-comerciais usam para aprimorar o serviço, identificar falhas etc.

Os recursos do usuário, previstos na cláusula 10.4, podem ser usados para treinar IAs, mas apenas com o consentimento explícito do usuário.

Ao entrar em uma chamada em que esse uso é possível (ele precisa ser ativado previamente pelo anfitrião ou empresa), um aviso é exibido com a opção de deixar a sala, caso a pessoa não concorde com a cessão de dados para treinar IA.

Smita Hashim, diretora de produtos do Zoom, tentou apagar o incêndio de relações públicas com um post no blog da empresa. Em dois momentos, ambos em negrito para dar ênfase, ela escreveu:

Para IA, não usamos conteúdo de áudio, vídeo ou mensagens para treinar nossos modelos sem o consentimento do cliente.

Uma variação da mensagem também foi adicionada à cláusula 10.4 dos termos de uso, por ora apenas na versão em inglês, nesta segunda (7).

Em março, o Zoom lançou recursos de inteligência artificial que automatizam algumas tarefas típicas em videochamadas, como redação de um resumo da conversa/reunião, sob a marca Zoom IQ.

Desde a surgimento meteórico do ChatGPT, as pessoas aprenderam melhor o funcionamento de modelos de IA e a natureza dessa tecnologia, subproduto de quantidades gigantescas de conteúdo, tão grandes que é quase impossível trabalhar apenas com conjuntos de dados sintéticos.

Perto do que OpenAI, Google e outras fizeram — pegar dados da web aberta e de plataformas como Reddit e Twitter sem nem avisar —, a postura do Zoom me parece menos pior.

E até as piores situações têm um lado bom. A confusão com os termos de uso e IA abafou outra notícia com potencial polêmico ainda maior para o Zoom: a empresa, que cresceu horrores durante a pandemia ao viabilizar o trabalho remoto por videochamadas, vai obrigar todos os funcionários que residam num raio de ~80 km de um dos seus escritórios a trabalharem presencialmente pelo menos dois dias na semana.

A nuvem que consome água

A palavra “nuvem” foi adotada pela indústria de tecnologia para se referir aos grandes parques de servidores escaláveis.

Graças a ela, qualquer empresa, startup ou empreendedor individual não precisa mais arcar com os altos custos iniciais de infraestrutura para lançar um serviço na internet. A nuvem permite começar pequeno (e gastando pouco) e crescer de modo contínuo, de acordo com a demanda, rápido ou devagar.

É um modelo genial. Não à toa, os líderes do setor — Amazon Web Services, Google Cloud e Microsoft Azure — ficaram enormes e são muito lucrativos.

Como toda tecnologia transformadora, ficamos fascinados com o lado bom da nuvem e nos esquecemos dos riscos da concentração de mercado, indisponibilidade pontual, segurança e custos colaterais, ocultos pela sombra do otimismo que o progresso tecnológico impregna em si mesmo. Raros e/ou incipientes, mas ainda assim presentes, esses riscos em geral revelam a natureza física da nuvem, levantada com muitos recursos naturais limitados, como metais raros, silício e água.

Chamou-me a atenção esta reportagem da Bloomberg (sem paywall) mostrando regiões que sofrem com secas históricas e, ao mesmo tempo, abrigam grandes data centers de empresas como Meta, Microsoft e Amazon.

Esses data centers, os endereços físicos da “nuvem”, consomem quantidades enormes de água. Um da Meta em Talavera de la Reina, na Espanha, ainda no papel, deverá gastar 665 milhões de litros por ano. Nos momentos de pico, serão 195 litros por segundo para arrefecer máquinas que sustentam a nuvem digital.

Não por acaso, data centers do tipo têm gerado insatisfação e antipatia das pessoas que moram nos locais onde estão instalados ou pretendem se instalar. De repente, elas se veem obrigadas a dividir a pouca água com computadores.

É irônico que a “nuvem” dos titãs da tecnologia se comporte de maneira oposta à da natureza: em vez de trazer água, consome-a. A menos que se conte como “água” aquele barulhinho de chuva do streaming, possível apenas graças à nuvem digital.