Estou muito frustrado com o atual estágio de desenvolvimento da IA (Inteligência Artificial).
Ontem passei 3 horas copiando e colando conteúdo de uma planilha para uma apresentação. Tanto Gemini quanto ChatGPT disseram que não podiam fazer isso por mim, apenas me dizer como fazer.
Anteontem passei vergonha conduzindo um Workshop sobre IA para 40 pessoas, quando o Microsoft Copilot não conseguiu formatar adequadamente um JSON, apesar de multiplas iterações.
Claro, só o fato de existir uma IA capaz de me responder que não pode me ajudar com isso e me dar um passo a passo para eu fazer eu mesmo já é um grande avanço comparado com 2 anos atrás.
Aquele momento no tempo, marcado para a maior parte do mundo pelo lançamento do ChatGPT, representa um ponto de inflexão, onde a capacidade da máquina de compreender linguagem e usar ela para se comunicar com nós seres humanos se tornou "mainstream". E isso muda tudo.
Tudo mesmo? Bem, isso é a raiz de uma mudança significativa. Agora para manipular um algoritmo de AI para me entregar resultados, informação, não é mais necessário conhecimento técnico, mexer em código, dados de treinamento. Pode ser necessária alguma didática e paciência, mas se tornou basicamente uma conversa.
O potencial que vejo é de se criar uma camada de linguagem na forma como interagimos com tecnologia. Em muitos casos de uso esse potencial representa uma melhoria drástica de experiência.
Mas não parou por aí...
Os avanços de Google e OpenAI
Os anúncios dessa semana da OpenAI e do Google mostram um avanço significativo dessa experiência. A capacidade de interagir com esses novos modelos usando diferentes tipos de linguagem (voz e video em tempo real) torna essa conversa com a máquina ainda mais poderosa e natural. Não faltam nas redes sociais referências ao filme her. Parece que esses novos avanços da tecnologia deixarão nosso mundo bem mais parecido com o do filme.
Esse desenrolar seria surpreendente 2 anos atrás. Mas em retrospecto parece natural. O que está acontecendo é que criamos um mundo cheio de informação e conteúdo pensados para os seres humanos consumirem. Agora estamos ensinando a máquina a consumir esse mundo.
Se ela vai consumir só o conteúdo para nós ajudar a interagir com o mundo ou se vai acabar consumindo o mundo todo é a questão tão debatida do alinhamento, ou em outras palavras o que define se vamos viver o apocalipse da IA ou um futuro abundante por conta dela.
Mas continuo frustrado. Nenhum desses avanços resolve a meu problema de ontem. Ainda que eu instale o app desktop da OpenAI e compartilhe a tela com o ChatGPT, ele não vai copiar e colar o conteúdo por mim. Pode até enxergar que o JSON está dando erro e corrigir mais rápido, mas meu sonho de me tornar um super humano powered by AI, que não precisa mais fazer esse tipo de atividade manual ainda não se realizou.
O próximo passo
Do momento do anúncio para cá eu consumi um blog post do Sam Altman e uma entrevista com ele. E foi aí que eu tive a realização que mudou meu sentimento.
Sam menciona que poderemos dar a liberdade à máquina de tomar ações em nosso nome. Isso pode ter várias interpretações, mas a mais óbvia e imediata para mim é que vou poder permitir que ela copie e cole o conteúdo de uma aplicação para a outra.
[Tocando Aleluia no fundo enquanto meus olhos se acendem como faróis de milha]
Pelo amor de Deus Sam, onde é que eu assino para dar essa autorização?!?
Clicks and Keys are all that's missing
O que falta é isso. Se a AI já pode ver e entender o que está na tela do meu computador ou celular, ou o que a câmera está vendo, só falta ela poder interferir. Quando ela puder interagir com a tela, clicando e digitando... Bom, aí sim isso muda tudo.
Aí terei o robozinho que trabalha para mim, sob a minha orientação. Uma IA que é capaz de usar qualquer aplicação porque elas foram desenhadas para humanos, mas a máquina aprendeu a falar "humano", a entender um mundo feito para nós consumirmos e a consumir (e interagir) com ele por nós.
🤯
Como um futurista incorrigível não consigo parar de pensar nos possíveis impactos disso para o mundo. Para o mundo do software, com o qual tenho mais intimidade, a mudança vai ser dramática. E consequentemente para o mundo das startups, do empreendedorismo, do Venture Capital.
Dá para escrever capítulos e capítulos com o que se passa na minha mente agora. Mas vou resistir à tentação de transformar esse artigo em um livro hoje mesmo e vou deixar essa discussão para os próximos!