Redes neurais sonham com ovelhas elétricas?

Filhote de ovelha encarando a câmera

Se você usou a internet hoje, provavelmente interagiu com uma rede neural. Elas são um tipo de algoritmo de aprendizagem de máquina que é usado para tudo, de traduções a modelos financeiros. Uma de suas especialidades é o reconhecimento de imagens. Muitas companhias — como Google, Microsoft, IBM e Facebook — possuem seus próprios algoritmos rotular fotos. Mas esses algoritmos de reconhecimento podem cometer erros bizarros.

Foto de uma paisagem com a leitura algorítmica na legenda, em inglês.
Um rebanho de ovelhas pastando em uma encosta verdejante.
Tags: pastar, ovelha, montanha, gado, cavalo

Quem definiu a legenda da foto acima foi a API de pesquisa visual computacional do Microsoft Azure. Mas não existem ovelhas na foto. Nenhuma. Dei zoom em tudo e inspecionei todas as manchas.

Foto de uma paisagem úmida com legenda gerada por algoritmo no rodapé.
Close de um campo verdejante
Tags: grama, campo, ovelha, de pé, arco-íris, homem

A tag “ovelha” também foi adicionada a esta outra imagem. Por acaso soube que havia ovelhas nos arredores, mas nenhuma está presente.

Foto de uma colina com legenda gerada por algoritmo no rodapé.
Close de uma encosta próxima a uma colina rochosa
Tags: encosta, pastar, ovelha, girafa, rebanho

Aqui, mais um exemplo. Na real, a rede neural alucinou com ovelhas toda vez que viu uma paisagem desse tipo. Por que isso acontece?

A maneira como as redes neurais aprendem é olhando para muitos exemplos. Nesse caso, seus treinadores mostraram diversas imagens rotuladas manualmente por humanos — e ovelhas estavam presentes em muitas dessas imagens. Sem qualquer conhecimento prévio do que estavam vendo, a rede neural teve que inventar regras para definir quais imagens poderiam ser rotuladas como “ovelha”. Parece que ela não percebeu que “ovelha” é, na verdade, o animal, e não um tipo de gramado sem árvores. (Da mesma forma, a rede neural marcou a segunda foto como “arco-íris” provavelmente porque estava chuvoso e úmido, sem perceber que o espectro de cores é essencial.)

Seriam as redes neurais apenas hiper vigilantes, vendo ovelhas em todo lugar? Não é bem assim. Elas só veem esses animais onde elas esperam vê-los. As redes encontram ovelhas facilmente em campos e penhascos, mas quando ovelhas começam a aparecer em lugares inusitados, fica explícito como os algoritmos confiam em probabilidades e adivinhações.

Coloque as ovelhas dentro de uma casa e elas são rotuladas como gatos. Pegue uma ovelha (ou uma cabra) no colo e elas são rotuladas como cachorros.

Fotos de crianças segurando ovelhas e os rótulos gerados por algoritmo embaixo.
Esquerda: Um homem segura um cachorro em seus braços
Direita: Uma mulher segura um cachorro em seus braços

Pinte-as de laranja e elas viram flores.

Foto de ovelhas laranjas em um campo.
Um grupo de flores laranjas em um campo

Coloque uma coleira na ovelha e elas são rotuladas como cachorros. Dentro de um carro, elas são cachorros ou gatos. Já se estiverem na água, podem acabar rotuladas como pássaros ou até mesmo ursos polares.

E se cabras escalarem árvores, elas se tornam pássaros. Ou possivelmente girafas. (O Microsoft Azure é notório em ver girafas em todos os lugares devido a uma suposta abundância de imagens de girafas em seu conjunto de dados original.)

Cabras em cima de uma árvore.
NeuralTalk2: Um bando de pássaros voando no ar
Microsoft Azure: Um grupo de girafas parado próximo a uma árvore

A questão é que redes neurais combinam padrões. Elas veem uma mancha com uma textura que parece pelagem do animal, um monte de verde da paisagem e concluem que se trata de uma ovelha. Se a rede vê a pelagem, mas junto a formatos típicos de uma cozinha, pode concluir que, em vez de ovelhas, são gatos.

Se a vida segue essas regras, o reconhecimento de imagens funciona bem. Mas assim que as pessoas — ou ovelhas — fazem algo inesperado, os algoritmos revelam sua fraqueza.

Quer esconder algo das redes neurais? Num toque deliciosamente cyperpunk, o surrealismo pode ser a resposta. Talvez, no futuro, agentes secretos se vistam com fantasias de frango ou dirijam carros com manchas que imitem vacas.

Outros muitos outros exemplos hilários podem ser vistos nesta sequência de posts no Twitter, que comecei com uma simples pergunta:

Alguém tem uma foto com ovelhas em um lugar bem estranho? É para sacanear um rede neural.

E você também pode testar o reconhecimento de imagens do Microsoft Azure e ver com seus próprios olhos que até mesmo algoritmos de alto nível dependem de probabilidade e de sorte. Outro algoritmo, NeuralTalk2, foi o que mais usei na sequência no Twitter, acima.


Publicado originalmente no aiweirdness.com em 2 de março de 2018.

Acompanhe

Newsletter (toda sexta, grátis):

  • Mastodon
  • Telegram
  • Twitter
  • Feed RSS

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

2 comentários

Do NOT follow this link or you will be banned from the site!