E se a IA generativa não for tudo isso?
Em novembro de 2023, em meio à confusão da demissão e readmissão de Sam Altman na OpenAI, saiu um rumor na imprensa de que a startup teria alcançado um novo patamar para a inteligência artificial (IA) generativa com um tal de Projeto Q*.
Segundo a Reuters, que deu a notícia em primeira mão, o Q* seria “um novo modelo capaz de resolver certos problemas matemáticos”.
Notícia estranha. Se tem uma área em que computadores sempre foram bons, é a matemática. Como alguém disse no Bluesky, demorou 80 anos, trilhões de dólares em pesquisa e a produção de CO2 de um país de porte médio para, enfim, inventarmos computadores que são ruins em fazer cálculos.
***
“Alucinação” é o termo forjado pela indústria para se referir a erros básicos cometidos por IAs. A promessa é de que eles diminuirão com o passar do tempo. É provável que sim. (Espero que no futuro elas alcancem a precisão de uma calculadora de R$ 1,99.) A dúvida é se as alucinações diminuirão a ponto de tornarem a ferramenta confiável e se esse é o único obstáculo à adoção em massa da tecnologia.
Faço uma aposta ousada aqui: a de que, talvez, o impacto da IA generativa será menor do que a indústria promete.
Se eu estiver correto, a IA generativa será apenas mais uma, mas a maior das promessas vazias de empresas desesperadas para emplacar a próxima grande onda da tecnologia. Será um NFT com alguma utilidade, um metaverso que você usa vez ou outra em vez de só uma vez, quando compra ou experimenta um headset de realidade virtual, um… você entendeu.
E se for só isso mesmo, temos um problema em mãos. O volume de dinheiro injetado pela big tech e por investidores de risco em startups, profissionais e a euforia de todos os envolvidos dão contornos de bolha a esse nascente e promissor mercado.
Não sou só eu dizendo. Além dos “pessimistas” de plantão, grupo em que costumo me encaixar (eu sei, eu sei), os números parecem contradizer o otimismo das Microsoft, Google e Meta da vida, das OpenAI e Anthropic que garantem que vão mudar (ou destruir) o mundo. Publicações de negócios, como Financial Times (sem paywall) e Wall Street Journal (sem paywall), começam a manifestar ceticismo. O WSJ fala abertamente do risco de bolha (sem paywall).
***
Num esforço para tentar enxergar o que os otimistas veem, tenho acessado com mais frequência o ChatGPT em tentativas de resolver pequenos perrengues do dia a dia.
Utilidades que encontrei até agora:
- Desenvolver scripts em JavaScript, linguagem que não entendo. (Um ou outro está rodando em produção no site do Manual.)
- Criar expressões regulares.
- Corrigir a gramática e ortografia de textos em inglês.
- Transcrever áudios, coisa que faço localmente, usando o Whisper da OpenAI, com o aplicativo Whisper Transcription.
(Estou aberto a mais sugestões!)
É útil? Marginalmente. Nada essencial, apenas “bom de se ter”. Não são aplicações que me fariam pagar R$ 100/mês no ChatGPT Plus, e não sei se valem o gasto (desperdício?) energético monumental dos super computadores necessários para treinar e inferir respostas das IAs generativas.
A indústria tem focado em clientes corporativos para fazer dinheiro com IA. Empresas como Microsoft, Google e OpenAI oferecem as suas como assinaturas caras (cerca de ~US$ 30/mês por usuários) para supostamente aumentar a produtividade de funcionários.
No mundo corporativo, porém, ainda existem muitas dúvidas quanto ao custo-benefício da IA generativa. Um vice-presidente da Intel, Arun Gupta, comentou:
Quando entramos em uma discussão de CIOs, [a conversa] é “Como posso usar IA generativa?” E eu fico… tipo, “Não sei. O que você quer fazer com isso?” E a resposta é: “Não sei, você vai descobrir!”
Por outro lado, vez ou outra vejo gente que passou ilesa por bobagens como NFT e web3 apostando todas as fichas em IA generativa. É o caso de Manton Reece, criador do serviço de blogs Micro.blog. Dá o que pensar.
Nem vou entrar no mérito dos CEOs de empresas investindo pesado em IA. Satya Nadella, da Microsoft, já comparou a IA com a internet e o salto da bicicleta para o motor a vapor. Sundar Pichai, da Alphabet (Google), foi mais longe: a IA pode ser mais profunda que o fogo e a eletricidade.
Zuckerberg, pelo menos, é honesto nesse sentido e não disfarça que só quer usar IA para manter usuários do Facebook e Instagram grudados em telas vendo anúncios.
Foto do topo: CHUTTERSNAP/Unsplash, com edição de Rodrigo Ghedin.
Os meus maiores problemas com as ia gerativas sao o roubo de dados escancarado e os recursos energeticos. Acho uma piada de mal gosto os gastos energeticos serem basicamente escondidos, tenho muitos amigos acadêmicos e professores que usam pra organizar e revisar conteúdo, mas eu não consigo, tenho muita raiva sempre que sou levado a usar o firefly integrado no photoshop no trabalho, o último cliente no estúdio usou pra gerar parte do visual de uma campanha e o trouxa aqui teve que consertar coisa de ia podre e depois trabalhar a ponto de caixa na velocidade 20 e com isso usar um monte aquela porcaria.
Uma parada que esqueci de falar, sobre gasto energético, acredito que o processamento possa ir para local com todo aparente esforço de fabricante de chips. Intel querendo dar uma rasteira na AMD que não para de crescer, AMD não quer ficar pra trás e fabricantes de arm correndo também. Talvez esse aspecto seja corrigido, espero que seja né. Agora o roubo de info é um problema incontornável, essas llm só funcionam assim.
Eu juro que tentei, mas toda vez que usei IA pra me ajudar com programação ela gerou código que não fazia o que eu pedia, fazia errado ou sequer compilava, me obrigando a revisar, o que é mais trabalhoso e demorado que se eu tivesse digitado o código desde o começo.
Não é só tu, eu postei sobre isso no meu mastodon com uns casos que tem dado mais problema que solução.
https://mastodon.gamedev.place/@Andre_LA/112372704903419885
A propósito, eu gostei de usar o codeium como um autocompletor, ou seja, ele n escreve a solução pra mim, eu vou escrever, e aí a LLM me ajuda a economizar meus dedos ao escrever o que eu já iria escrever de qualquer forma.
Pra esse fim funciona bem.
O pronto principal da IA é que quem usa tem que saber o mínimo para, pelo menos, conseguir entender se ela está fazendo m**** ou não.
É um novo google, ele complementa a pesquisa e facilita o dia a dia. Não necessariamente substitui, mas conforme o caso – ainda mais em “buscas que quebram o google” por terem muitas palavras normais, ele é melhor.
As vezes simplesmente não quero pensar em “palavra ação powershell reddit”, ou simplesmente pensar em si, acho realmente fácil perguntar conforme o que preciso: tenho um servidor exchange 2016. Estou no processo de migração das contas para o Microsoft 365. Como eu verifico quantas, e quais as contas, que não migraram ainda portanto permanecem com o email em meu servidor? Forneça um script em powershell. e receber o esperado, seguindo desse ponto até alucinar ou se perder.
NÃO VAMOS CURAR CANCER. A idiotice de “maior invenção que o fogo” dói na alma, é um sintoma de tudo que está errado.
Mas isso não é NFT. E espero que seja sustentável para as empresas.
A comparação com o Google é ótima, embora eu odeie usar LLM pra pesquisar, queria que o Google voltase a funcionar direito kk.
Mas gosto da comparação porque um motor de pesquisa é uma ferramenta muito essencial, porém não é o que resolve o problema em si.
LOL!
Prever que metaverso e NFT eram bolhas não necessitou grande esforço, não é mesmo? Os próprios conceitos eram claramente falhos, então nem precisou esperar pelo seus fracassos. Mas IA chegou para ficar, sem absolutamente nenhuma dúvida. Claro, é provável que o modelo generativo fique obsoleto em algum momento não tão distante, mas isso não muda o fato de que essas ferramentas (que surgiram basicamente ontem) já mudaram o mundo. Quem programa e revisa textos sabe bem disso. Fora a questão de resumo e interpretação de textos. Para essas coisas já está num nível excelente, ainda que, assim como humanos, não seja perfeito. E essa tecnologia é um claro exemplo de progresso exponencial, pois as versões seguintes são desenvolvidas usando a anterior como ferramenta.
Vai haver muito caos ainda porque, como você colocou, tem muita empresa investindo e isso claramente vai causar uma bolha. Quem vai ganhar essa guerra certamente será quem tiver menos vergonha de minerar dados, e nesse aspecto já sabemos bem os players com mais chances.
O que realmente me preocupa nessa história é o número de empregos que simplesmente deixarão de existir, ou que vão ter demanda extremamente reduzida. Já está acontecendo, inclusive. E ninguém, nem mesmo a União Europeia, sabe o que fazer. Uma crise séria está por vir, em conjunto com a crise climática e isolamento social.
Embora eu desgoste, tenho pesquisado de tempos em tempos sobre porque creio que a IA tá sim pra ficar da mesma forma que a internet ficou.
O ponto é saber a diferença sobre o que a tecnologia faz e suas consequências e o marketing que as empresas fazem.
O marketing diz que você pode entregar suas atividades pra IA que ela fará em menos tempo e melhor.
Por exemplo, com programação.
A realidade é que mantenedores de software tem relatado maior dificuldade em receber contribuições relevantes visto que as entregas tem sido gerados por IA e são problemáticas e até inúteis, desperdiçando tempo ao invés de ganhar e ofuscando contribuições genuínas, além de que código gerado tem precisado de mais retrabalho por serem ruins (não to inventando isso, tem um estudo da GitClear sobre isso e vi uns mantenedores de software livre, incluindo o do cURL e Servo, tendo que lidar com esse spam).
O que tem de fato valor é utilizar a IA pra fazer algo que você já faria de qualquer forma.
IA gerativa de código é ótima pra gerar boiderplate e autocompletar código que já seria digitado de qualquer forma (o que infere tu tem que saber o que tá fazendo primeiro)
Num vídeo recente do Gaveta ele comenta de uns usos que, justamente, não se tratam de “huehue vou gerar tudo com IA”, mas sim de autocompletar cenas ou detalhes da cena que já teriam que ser feitas de qualquer forma.
Dito isto, nesse vídeo do Gaveta, não é um app de IA que ele mostra, mas o Premiere, da Adobe.
E ele também cita um vídeo de um colega dele que creio eu que seja a interface do Comfy, que envolve prompting, mas é realizado num grafo de nós que se assemelha aos grafos de produção de VFX, que é bem mais complexo.
O significado de “UI”, interface de usuário, é da ponte que conecta o usuário com o computador.
Duvido muito que no futuro ficaremos todos escrevendo prompts com IAs, e sim apps tais quais as atuais que serão muito capazes, mas nada milagroso como o marketing diz.
Creio que a IA tá aqui pra ficar, só que não ao ponto de retornar esse investimento absurdo que tão colocando aí, especialmente nas empresas com uns usos bem burros.
O que é mais importante que tudo isso entretanto é como vamos lidar com a possibilidade de criação de lero lero em massa, como tem sido o caso dos mantenedores de software que comentei mais cedo.
Por fim, recomendo bastante darem uma olhada nos modelos abertos, como Mistral ou llama 3.
Pelo llamafile consegui rodar o llama 3 8B no meu PC, sem precisar entregar meu dinheiro ou meus dados pra nenhuma empresa.
Eu suponho que talvez vamos ver mais dessas LLMs offline e locais rodando nos nossos dispositivos no futuro.
Anyway, só pra concluir, mesmo que eu desgoste muito (odeio a OpenAI por ex), pesquisar sobre direto da fonte ao invés dos produtos tem desmistificado e até me tranquilizado.
O importante é ter os pés no chão e nunca acreditar em hype 👍.
(E perdão pelo textão)
Ghedin, compartilho aqui o artigo Promessas, Mentiras e uma visão sobre o Mercado de Inteligência Artificial do Victor Hugo Germano que vai bem de encontro com o seu texto.
Segundo comentário pra não misturar com a ideia do primeiro :)
Sobre a IA em geral, precisamos encarar ela como uma ferramenta que pode nos fazer trabalhar menos. As pessoas estão doidas com a ideia de que “vamos perder o emprego” que se esquecem que a IA pode gerar um atrito trabalhista a nossa favor (trabalhadores) no sentido de criar um novo conceito de trabalho. Processos repetitivos como relatórios, planilhas, gráficos etc. podem ser automatizados com uma IA bem treinada. Podemos, finalmente, pleitear uma semana de 4 dias com a mesma entrega de uma de 5.
Nesse ponto entra o que eu sempre digo: o capitalismo está tão arraigado nos seres humanos que é inconcebível perceber outro dinâmica. Nem quem é progressista consegue pensar em diminuir a carga de trabalho atual com a IA. Eu sei que é dificil porque EMPRESAS, mas se a gente não consegue sequer vislumbrar um mundo onde o trabalho não é o centro da nossa vida, estamos MUITO perdidos. Eu prefiro pensar na IA como uma ótima ferramenta pra fazer coisas chatas.
Paulo, acho que o problema não é o capitalismo arraigado em nós, mas o histórico de toda tecnologia que prometeu “reduzir o trabalho” desde a criação do capitalismo. O efeito foi sempre o oposto — maior produtividade implicando em menos empregos e mais sobrecarga em quem permanece na força de trabalho. Por que você acha que será diferente desta vez?
A depender das empresas e da burguesia, não será.
Mas o meu ponto é que a luta (no sentido de embate) não deveria ser focada na IA e nos LLM e sim contra o sistema e contra as empresas.
Exemplo: nos anos 1900 trabalhávamos 12h por dia, sem férias, sem licenças, sem atestados. Hoje trabalhamos, ainda, 8h por dia (a maioria) por 5 dias. Não podemos deixar de imaginar que é possível diminuir ainda mais isso.
Se depender das classes dominantes, das empresas, do capitalismo; vamos trabalhar mais e mais e ganhando cada vez menos, mas nesse sentido, o problema não é a IA, o problema é o capitalismo. E nesse ponto é que eu sigo batendo na tecla que, pelo que eu vejo, as pessoas simplesmente não conseguem imaginar algo fora do 9-18 de seg-sex (o que já é um privilégio, ainda mais com a escala 6×1 no Brasil) e lutam pra manter isso com medo de perder.
Infelizmente, tudo o que a classe trabalhadora teve até hoje foi com base em luta, morte, atrito e sangue derramado. A burguesia não vai entregar o trabalho semi-0escravo do capitalismo de mão beijada, claro, mas nesse contexto devemos escolher as batalhas. E eu tenho uma boa dose de certeza que não temos como frear a IA (assim como tínhamos como frear o PC, a internet, o Google e outras tecnologias). Mas podemos usá-las pra melhorar a nossa vida.
Parece-me (lembrando sempre que sou leigo) que são lutas paralelas com alguns pontos de contato. O apelo das IAs generativas vai de encontro às demandas de quem está no poder — aumentar a produtividade pagando menos.
Se não precisássemos ser tão produtivos, a demanda por geradores de lero-lero e máquinas que cospem código ainda existiria?
Outra preocupação é que elas não existem no vácuo. O espaço que tomam de, por exemplo, artistas, é justo? O custo ambiental, válido? Acho que tem várias questões aí.
Isso está BEM errado. Computadores são bons em fazer contas de forma rápida, mas são péssimos em fazer cálculos de fato. Um computador é muito ruim pra resolver um problema de Análise Real, por exemplo; contudo, existem GPT’s que fazem isso bem (são treinados com livro-texto de Análise Real) a ponto de realmente fazer a diferença na área. O principio norteador para matemática na internet deve ser o de que “a internet (pessoas) não sabe matemática” [e nem estatística]. Se um LLM vai conseguir nos ajudar a resolver problemas complexo, como os problemas do milênio,é um salto muito grande, de fato, mas por enquanto, essas IAs são os melhores matemáticos generalistas que temos acesso.
Eu não duvido que as IA por aí sejam quase “mágicas”. Eu uso pouco, poderia usar mais e talvez mesmo versões gratuitas fossem úteis. E, na real, acredito mesmo em quem diz, como alguns comentários aqui, que a IA é super-útil e mudou a forma como trabalham e etc e etc. O problema que eu vejo aqui é de custo: talvez o melhor título da coluna fosse “E se a IA não for tudo isso a ponto de justificar seu custo?”. No fim do dia, o benefício pontual e individual pode ser maravilhoso, mas o benefício coletivo só existe se a IA escalar para grandes grupos de pessoas, como a minha non-tech mãe ou a sua non-tech avó, ou ainda se tornar “invisível” e estiver integrada a ponto de atingir as pessoas sem que elas saibam. Mas isso hoje tem um custo proibitivo e por conseqüência um prejuízo enorme para quem está desenvolvendo (Big techs na maior parte dos casos). E as big-techs vivem de lucro (qual empresa não vive?). Então, se a IA não ficar mais barata ou não for “o novo fogo” que escale a todos apesar do custo alto, vai ser difícil que seja sustentável.
Isso, Emanuel. Sem falar em outro tipo de custo, não financeiro, que é o consumo exacerbado de recursos naturais para turbinar os data centers responsáveis pelo treinamento e inferências dessas IAs. Acho esse custo tão preocupante quanto.
Esse é um problema dos mais sérios. É um custo intangível mas altamente palpável, em ondas de calor, regime maluco de chuvas, alagamento em Dubai e no rio grande de sul, desertificação no nordeste. É exasperante como toda a indústria envolvida no caso negligencia esse custo. De fato, é mesmo curioso (ou vai ser curioso) ver como a Apple, por exemplo, vai abordar isso aí: eles já disseram que vão pôr IA no próxima iphone (e supostamente computadores e afins). Como eles vão conciliar isso com um “pegada zero de carbono”, proteção ao meio ambiente e patati e patatá.
Não vão, a apple só usa essa pauta ecológica quando é pra tirar o carregador do aparelho
Eu também acho João. E isso só reforça a ideia de que não há empresa boazinha.
Para conhecer o real potencial das IAs generativas, é preciso dedicar tempo e estudo para criação dos prompts. A maioria das pessoas usa como se estivessem pesquisando no Google, e coisas do tipo: “crie um texto assim e assado”. E em casos como este, os resultados são péssimos, genéricos e que nos fazem pensar que a ferramenta é ruim. Mas existem serviços diferentes, para usos distintos, em versões diferentes e com maneiras de usar de maneira distinta.
Outro engano é achar que o assistente de IA vai te entregar tudo pronto, só para copiar e colar, e não vai. Ele é um co-piloto (a Microsoft escolheu um ótimo nome), que vai te der ideias, mostrar um caminho que pode ser seguido, e a partir dali, é com você. Para quem trabalha com criação, ajuda muito.
Com o Gemini 1.5 Pro, dentro do ambiente Google AI Studio, por exemplo, eu posso enviar arquivos de vídeo, áudio, imagens, documentos de tamanhos grandes (graças aos 1 milhão de tokens) e pedir para que o Gemini aprenda aquele conteúdo, aquele estilo de escrita, aquele estilo de didática e, a partir dali, ir construindo ideias para novos conteúdos.
Eu tenho feito muitos usos no meu dia a dia. Uso, principalmente, o Copilot em sua versão gratuita, – que já conta com o GPT 4 e que tem um botão nativo no navegador Edge, em que ele pode analisar documentos em PDF, páginas de sites e até vídeos do YouTube e fazer interações específicas com aquele conteúdo – e o Gemini Advanced (versão paga), mas sempre dentro do Google AI Studio, que é onde tem sua melhor versão. Os usos vão desde traduções, correções de texto, análise dos termos de contratos, ideias de títulos de vídeos e artigos, ideias de conteúdo escrito ou em vídeo, ideias de roteiros de vídeos para clientes, aprender sobre novos assuntos (com indicações de bibliografia e uma introdução detalhada), resumo de artigos em outros idiomas que não domino, resumo de vídeos, até planejamento estratégico organizacional (seguindo uma metodologia específica) estou fazendo com ajuda da IA, e tornando essas tarefas muito mais fáceis e demandando bem menos tempo. Mas em praticamente nenhuma delas eu copiei e colei, elas me deram ideias e um ponto de partida.
Estranho ter esse tipo de opinião num blog de tecnologia. A IA generativa é, sim, uma revolução na tecnologia, e continua a evoluir em PG. O outro problema é que a IA que temos acesso está bem capada por diversos motivos, principalmente por motivos legais, então pare por um momento para pensar sobre a IA que não temos acesso, mas apenas os labs e, claro, os militares….
Enfim, eu mesmo não uso muito o ChatGPT, porque prefiro ler artigos e conflitar suas informações para chegar à minha conclusão, mas dizer que a IA generativa “não vai pra frente” me parece uma opinião estranhamente ludita.
Você é novo por aqui, Adriano?
não.
Então devia saber que esse é o tipo de opinião típica daqui: crítica, olhando a tecnologia de um ponto de vista humano e social. Pode ser uma revolução, mas é suficiente revolucionária para justificar os danos que têm causado? É uma pergunta sem resposta ainda.
O seu texto veio a calhar com a notícia que o Mark vai colocar a Meta com muito foco em IA e ficou um sentimento parecido com o hype do metaverso.
Gostei de ver de volta as indicações do diretório (impressão minha ou não estavam vindo nos últimos textos).
Que bom que curtiu, Gabriel! Não estavam. Tinha parado no fim do ano passado para organizar a bagunça lá — remover newsletters inativas, excluídas etc.
O problema de toda nova tecnologia que surge com o hype das grandes empresas é que eles querem nos forçar a usar, mesmo que ela não seja tão boa. Não gastam apenas com o desenvolvimento tecnológico, mas também com lobby e propaganda.
Eu cheguei a essa conclusão recentemente.
Quando o ChatGPT foi lançado eu achei maravilhoso. Trabalho com marketing, então ter à disposição uma ferramenta capaz de criar textos inteiros a partir de poucas palavras parecia bom demais para ser verdade.
Pouco tempo depois eu descobri que sim, era bom demais pra ser verdade.
O ChatGPT e suas variantes (Copilot, Gemini etc.) não escrevem, eles geram texto. E isso é uma diferença fundamental. Pra quem tem o costume de ler, hoje já é muito fácil perceber quando um texto foi feito com IA. Se a pessoa não dedicou tempo para escrever algo, por que eu perderia meu tempo para ler esse algo?
Mas sim, a IA generativa ainda tem alguns usos pontuais na minha rotina. Eu gosto de utilizá-la para procurar pesquisas muito específicas ou para me lembrar de alguma palavra que está na ponta da língua.
É legal? É, mas como disse Ghedin, não justifica pagar 100 reais por mês e nem o investimento nababesco que a big tech vem fazendo na tecnologia.
Outro dia escutei alguém falando (não lembro mesmo, acho que foi no podcast Bungacast) que se a IA, na realização de atividades relativamente complexas e potencialmente lucrativas (o exemplo era a área médica), nunca se tornar independente de uma supervisão por um profissional especializado, a realidade é que ela não vai baratear esse tipo de serviço, mas sim encarecê-lo substancialmente. Ainda mais se pensarmos que em algum momento o dinheiro de capital de risco jorrando nessas aplicações pode começar a rarear.
Parece um argumento bem realista contra o potencial desruptivo da IA.