ChatGPT consegue adivinhar o local de fotos

Não que eu me orgulhe disso, mas a verdade é que perdi o fio da meada dos lançamentos da OpenAI. Na quarta (16), a empresa anunciou dois novos modelos, o3 e o4-mini, com curiosos desdobramentos.

O o3 é definido pela OpenAI como “o nosso mais poderoso modelo de raciocínio”; o o4-mini, um “modelo menor otimizado para raciocínio rápido e eficiente em custo”. Ambos são acessíveis pela interface do ChatGPT e são capazes de lidar com vários ferramentais, como a análise de arquivos enviados.

Um dos exemplos dados pela OpenAI no anúncio oficial, do tipo “pensar com imagens”, parece ter disparado uma nova febre: descobrir a localização de imagens a partir delas próprias, uma espécie de pesquisa reversa ou, como tem se falado nas redes sociais, “o fim do Geoguesser”.

O TechCrunch notou que o o3 não é muita coisa melhor que o GPT-4o, um modelo anterior e mais rápido, e que não é perfeito, errando os locais de várias imagens e, às vezes, sequer conseguindo dar um palpite. De qualquer modo, às vezes essa capacidade do ChatGPT assusta e cria, desde já, um novo vetor de paranoia com privacidade online: não basta mais limpar os metadados de fotos.

Pela própria natureza dos LLMs, é muito difícil distinguir avanços genuínos do entusiasmo da torcida. O Techmeme, um agregador do noticiário e de reações de gente da indústria da tecnologia, pescou este comentário de alguém no X:

Estou obcecada com o3. É muito melhor do que os modelos anteriores. Ele acabou de me ajudar a resolver uma questão psicológica/emocional com a qual tenho lidado há anos em três conversas (uma que não é socialmente aceitável compartilhar, e aqueles com quem eu compartilhei não ajudaram/não poderiam ajudar).

Fico me perguntando que tipo de “questão psicológica/emocional com a qual tenho lidado há anos” uma conversa com uma IA lançada há poucas horas poderia resolver.

***

A blitz de lançamentos da OpenAI está surtindo efeito. Em março, puxado por “trends” como a do estúdio Ghibli e a das caixas de bonequinhos, o ChatGPT foi o aplicativo mais baixado do mundo, segundo a consultoria Appfigures, desbancando Instagram e TikTok, líderes habituais nos últimos meses.

***

Nesta quinta (17), o Google liberou o Gemini 2.5 Flash, que “oferece uma grande atualização nas capacidades de raciocínio, ao mesmo tempo em que continua a priorizar a velocidade e o custo”. Talvez esse novo modelo consiga adivinhar a cor das nossas roupas íntimas e trazer a paz mundial.

O julgamento que pode separar Instagram e WhatsApp da Meta

Os julgamentos de casos antitruste nos tribunais estadunidenses talvez sejam a maior contribuição do país à humanidade depois dos ovos beneditinos e da Hollywood dos anos dourados.

Nesta segunda (14), teve início um dos mais aguardados dos últimos tempos, em que a Federal Trade Commission (FTC, espécie de Cade dos EUA) acusa a Meta de monopolizar o mercado de redes sociais pessoais, barrando concorrentes em potencial com as aquisições bilionárias de Instagram e WhatsApp. Um dos possíveis “remédios” é o desmembramento da empresa, restabelecendo Instagram e WhatsApp como alternativas independentes e rivais do Facebook.

(mais…)

FBI: O perigo em usar conversores de arquivos online

Em abril de 2024, o WordPress 6.5 trouxe, entre outras novidades, suporte nativo ao formato de imagens *.avif.

Pessoas normais só se importam com formatos de arquivos de imagens quando topam com incompatibilidades — a Apple e seu *.heic para fotos tiradas com o iPhone é, acho, a maior força de ~conscientização nessa frente. Eu, que sou anormal, passei meses refletindo se as vantagens evidentes do *.avif se sobrepunham à universalidade de antecessores menos eficientes, como *.jpg e *.png.

Faz algumas semanas, decidi dar o salto e adotar o *.avif para (quase) todas as imagens deste Manual.

(mais…)

O Geocities Time Machine transforma qualquer site moderno em uma obra-prima…

Print do Manual do Usuário como se fosse um site do Geocities dos anos 1990.

GIFs animados bregas (chamas, “em construção”, “novo” piscante), cores chamativas, texto em movimento com a finada tag <marquee>: está tudo lá. O Geocities Time Machine transforma qualquer site moderno em uma obra-prima dos anos 1990 — ou qualquer site da época hospedado no saudoso Geocities. A imagem ao lado é a deste Manual “geocitificado”. Dica do Antonio.

O batismo por analogia em dois níveis do GNU nano

O povo do software livre é cheio de gracinhas na hora de batizar suas criações. Estão aí o GNU (GNU’s Not Unix) e o Wine (Wine Is Not an Emulator) de provas.

No Mastodon, Simon Tatham contou a história do nano e seu batismo por analogia duplo:

O editor de texto GNU nano recebeu seu nome por analogia inspirado em um editor anterior (não livre) com uma interface muito semelhante, chamado pico. O nome faz um trocadilho com prefixos do Sistema Internacional de Unidades: “Tipo o pico, mas um pouco maior.”

O pico foi derivado do cliente de e-mail Pine [descontinuado]: é o editor embutido que o Pine usava para compor e-mails, que foi retirado e transformado em uma ferramenta independente. É uma abreviação de PIne COmposer, até onde eu sei.

E o Pine também foi batizado por analogia, a partir de um cliente de e-mail mais antigo chamado Elm. [São árvores em inglês, pinho e ulmeiro.]

Portanto, o nano tem dois níveis de “batismo de aplicativo por analogia a um anterior” em sua história. (Sem contar a etapa intermediária em que o Pine deu origem ao pico, porque esse não foi por analogia.)

Alguém consegue pensar em uma cadeia mais longa do que essa, envolvendo três ou mais níveis de batismo por analogia? Ou o nano é recordista?

Nas respostas, lembraram ainda do Micro, outro editor que se propõem ser um pouco mais completo que o GNU nano.

Short Trip é um passeio de bonde em um universo de gatos antropomórficos que, como…

Paisagem ilustrada, em preto e branco, com árvores e uma estação de bonde, e um gatinho vestido e de pé no centro da tela.

Short Trip é um passeio de bonde em um universo de gatos antropomórficos que, como o nome sugere, é bem curta. O que não significa que tenha sido rápido: Alexander Perrin gastou cinco anos (!) para concluir esta bela ilustração animada à mão. (Mais detalhes.) Os efeitos sonoros são agradáveis também. Se preferir, há uma versão que “adiciona um novo modo “programado” que integra o relógio do computador para criar um itinerário para o bonde” à venda no Steam.

Fedora Linux 42

Já está disponível a versão final do Fedora Linux 42, trazendo o Gnome 48 na edição Workstation e a nova baseada no KDE Plasma (versão 6.3.4), promovida neste ciclo ao mesmo status da Workstation. Apesar do mesmo status, a lógica dos nomes é diferente; o povo lá está ciente da confusão e afirma que “vamos resolver isso em algum momento”.

O Anaconda, instalador do Fedora, ganhou uma grande atualização que torna o particionador automático do disco mais esperto, traz a opção de reinstalar o sistema e lida melhor com “dual boot”. Por ora, o novo Anaconda só é padrão no Fedora Workstation (a edição com Gnome).

Ah, e uma falha de última hora acabou ficando:

Apenas inicializar o sistema direto do pen drive (“live media”) adiciona uma entrada inesperada ao boot loader UEFI, mesmo quando o Fedora Linux 42 não esteja instalado no computador local.

O transtorno é apenas cosmético, mas é bom saber de antemão. Aqui tem a orientação de como remover a entrada (em inglês).

O aplicativo gratuito Kwack (macOS) emite um “quac!” cada vez que uma tecla é pressionada

Print do site do Kwack, com a frase “Satisfatório ‘quac’ a cada tecla pressionada”.

Se você acha que teclados mecânicos com switches azuis incomodam, prepare-se porque tudo sempre pode piorar: o aplicativo gratuito Kwack (macOS) emite um “quac!” toda vez que uma tecla é pressionada.

Pinta 3.0

Logo do Pinta: pincel inclinado ao lado de uma bisnaga de tinta.

Saiu o Pinta 3.0, nova versão do editor de imagens levinho, tendo como destaque a migração para o GTK 4 e a Libadwaita — em outras palavras, a bem-vinda modernização do aplicativo para o Gnome.

Embora isso, por si só, já traga uma série de melhorias “de graça” ao Pinta, não é a única. Há novidades visíveis (novos ícones, menu, seletor de cores e camadas inteligentes) e por baixo dos panos (ajustes dinâmicos para diferentes tamanhos de e orientações de tela, suporte a gestos, mais velocidade e, espera-se, menos falhas).

O suporte a add-ins, que havia sido removido temporariamente na série 2.x, está de volta. Por ora, apenas dois fizeram a “passagem”, mas os desenvolvedores dizem que “é provável que mais sejam portados para esta versão e lançamentos futuros”.

A origem do Pinta remonta ao Paint.NET do Windows, ou seja, a proposta é ser um editor de imagens simples, mas nem tanto; o elo perdido entre o Paint e o Photoshop. O código é aberto e o app é compilado para Linux, macOS (agora com suporte a chips Apple), OpenBSD e Windows.

Em uma citação atribuída ao fundador do Spotify, Daniel Ek, durante uma reunião geral da empresa, ele diz: “Nosso único concorrente é o silêncio.” Ao que eu respondo: o inimigo do meu inimigo é meu amigo.

— Reuben Son.

No texto “Tempo de silêncio” (em inglês), Reuben explora a gênese, as reinterpretações e as quebras de paradigmas presentes na música ambiente — uma feliz coincidência à luz deste post que publiquei recentemente. Pontos extras pela abertura com uma citação de Clarice Lispector.

Entrevista com Bruno Natal, do podcast e newsletter RESUMIDO

Qual é a sua newsletter?

RESUMIDO.

Fale um pouco de você, Bruno.

Sou jornalista, documentarista, empreendedor e apresentador do podcast RESUMIDO.

(mais…)

O estúdio Oaksun desenvolveu uma experiência em realidade virtual otimizada…

Ambiente 3D, em realidade virtual, de uma sala de estar.

O estúdio Oaksun desenvolveu uma experiência em realidade virtual otimizada para dispositivos móveis que apresenta o imóvel de um jeito super imersivo. (Funciona legal em celulares e computadores, sem headset de realidade virtual.) Enquanto isso, no mundo real, a gente tem que lidar com aquelas fotos de cativeiro das listagens de apartamentos para alugar…

O Governo Federal continua se enroscando mais e mais no WhatsApp.

Por se tratarem de serviços de utilidade pública, faz sentido a adoção do aplicativo da Meta — de longe o mais popular do tipo no país. Ainda assim, fica aquele ~retrogosto ruim de ceder cada vez mais espaço ao WhatsApp em nosso dia a dia…

E, sim, estou ciente de que a assinatura do Manual tem, entre seus benefícios, o ingresso em um grupo fechado no WhatsApp.

A mesa de trabalho do Jônatas

Olá! Sou o Jônatas. Sou programador e também ensino assuntos de programação no meu canal no YouTube. Hoje aqui trabalho como desenvolvedor, faço aulas de alemão online, lives na Twitch e vídeos para o YouTube.

Meu setup começa com um Tuxedo InfinityBook Pro Gen 7, uma empresa que faz notebook focados em Linux na Europa e possui um sistema operacional próprio, o TuxedoOS. Aqui, porém, uso Arch Linux + Cosmic Desktop; para gravar, uso o KDE Plasma no lugar do cosmic.

(mais…)