ChatGPT consegue adivinhar o local de fotos

Não que eu me orgulhe disso, mas a verdade é que perdi o fio da meada dos lançamentos da OpenAI. Na quarta (16), a empresa anunciou dois novos modelos, o3 e o4-mini, com curiosos desdobramentos.

O o3 é definido pela OpenAI como “o nosso mais poderoso modelo de raciocínio”; o o4-mini, um “modelo menor otimizado para raciocínio rápido e eficiente em custo”. Ambos são acessíveis pela interface do ChatGPT e são capazes de lidar com vários ferramentais, como a análise de arquivos enviados.

Um dos exemplos dados pela OpenAI no anúncio oficial, do tipo “pensar com imagens”, parece ter disparado uma nova febre: descobrir a localização de imagens a partir delas próprias, uma espécie de pesquisa reversa ou, como tem se falado nas redes sociais, “o fim do Geoguesser”.

O TechCrunch notou que o o3 não é muita coisa melhor que o GPT-4o, um modelo anterior e mais rápido, e que não é perfeito, errando os locais de várias imagens e, às vezes, sequer conseguindo dar um palpite. De qualquer modo, às vezes essa capacidade do ChatGPT assusta e cria, desde já, um novo vetor de paranoia com privacidade online: não basta mais limpar os metadados de fotos.

Pela própria natureza dos LLMs, é muito difícil distinguir avanços genuínos do entusiasmo da torcida. O Techmeme, um agregador do noticiário e de reações de gente da indústria da tecnologia, pescou este comentário de alguém no X:

Estou obcecada com o3. É muito melhor do que os modelos anteriores. Ele acabou de me ajudar a resolver uma questão psicológica/emocional com a qual tenho lidado há anos em três conversas (uma que não é socialmente aceitável compartilhar, e aqueles com quem eu compartilhei não ajudaram/não poderiam ajudar).

Fico me perguntando que tipo de “questão psicológica/emocional com a qual tenho lidado há anos” uma conversa com uma IA lançada há poucas horas poderia resolver.

***

A blitz de lançamentos da OpenAI está surtindo efeito. Em março, puxado por “trends” como a do estúdio Ghibli e a das caixas de bonequinhos, o ChatGPT foi o aplicativo mais baixado do mundo, segundo a consultoria Appfigures, desbancando Instagram e TikTok, líderes habituais nos últimos meses.

***

Nesta quinta (17), o Google liberou o Gemini 2.5 Flash, que “oferece uma grande atualização nas capacidades de raciocínio, ao mesmo tempo em que continua a priorizar a velocidade e o custo”. Talvez esse novo modelo consiga adivinhar a cor das nossas roupas íntimas e trazer a paz mundial.

A newsletter do Manual. Gratuita. Cancele quando quiser:

Quais edições extras deseja receber?


Siga no Bluesky, Mastodon e Telegram. Inscreva-se nas notificações push e no Feed RSS.

4 comentários

  1. exitem coisas que não podem ser faladas para psicólogos, mas podem ser faladas para o chatgpt. se isso ajuda as pessoas, porque condenar?
    eu juro que queria entender esse ódio a uma ferramenta que tem se provado muito útil em quase todas as áreas possíveis.

    1. Eu jamais confiaria mais no ChatGPT que em um psicólogo para contar algum segredo. Fora a responsabilidade moral e legal, um “vazamento” pelo psicólogo é rastreável, tangível, ao passo que tudo que eu falo com o ChatGPT fica registrado e pode ser usado contra mim de mil maneiras, muitas delas sutis o bastante para desviar a suspeita do próprio ChatGPT.

      Eu juro que queria entender o entusiasmo das pessoas com tecnologias potencialmente danosas a elas mesmas.

      1. Fico a imaginar o tipo de coisas perturbadoras que alguém pode fazer quando não confia nem mesmo em contar a um psicólogo. É realmente assustador ver como as pessoas negligenciam a saúde mental a ponto de acreditar que conversar com um “gerador probabilístico de frases e sentenças” é mais adequado e seguro para seu bem-estar psicoemocional do que dialogar com um ser humano empático, que dedicou anos de sua vida, 5 apenas na graduação, para aprender a lidar com questões tão delicadas.

        1. Oi! Li seu comentário de manhã e estou até agora pensando nele. Se vc me permite, quero trazer outra perspectiva:
          Quando vc diz que imagina o tipo de coisa que alguém não consegue falar pra outra pessoa — isso acaba sendo um julgamento, né? E se vc, por exemplo, pensasse isso sendo um psicólogo, provavelmente não ia transpor isso numa consulta, mas a probabilidade de pensar isso, se quem fala tem noção disso, já atrapalha o desfazer da barreira de se comunicar.
          Uma pessoa que se dedicou estudando 5 anos ainda assim carrega uma bagagem emocional que inevitavelmente vai aparecer. Pode ser uma pessoa super empática mas classe média alta e tratar o indivíduo de um modo de um diferente contexto, não consiga atingir a alteridade pra conexão necessária…
          Um gerador de probabilidade estatística, viés de quem programou à parte e deixando de lado o fato de ser uma empresa lidando com dados sensíveis como apontado por aqui tb, acaba sendo um exercício complementar.
          E digo isso em causa própria, já fiz terapia e foi ok, mas hoje, devido a impedimentos financeiros, começar uma conversa com o chat mandando prompt de como eu quero que seja a escuta me dá um alívio muito terapêutico e válido e acho que isso vale muito e pode acrescentar, inclusive, a formação dos psicólogos :)

          Obs: sem contar que tem umas pessoas que se dizem terapeutas e que tem um preparo “alternativo” que pode ser muito danoso (tipo constelação familiar) ou uma abordagem clínica que acaba caindo dentro de um pensamento homogêneo, como já vi acontecer (“não pense assim, vai ficar tudo bem”)