Andrej Karpathy e a Revolução do Autoresearch: A Ciência Automatizada Enquanto Dormimos
No último fim de semana, Andrej Karpathy, ex-líder de IA da Tesla e cofundador do OpenAI, apresentou ao mundo seu mais recente projeto de código aberto: o autoresearch. Ao contrário de um produto corporativo robusto, trata-se de um script simples de 630 linhas disponível no GitHub sob a permissiva Licença MIT. No entanto, sua ambição é gigantesca: automatizar o método científico com agentes de IA enquanto nós, humanos, descansamos.
O Funcionamento do Autoresearch
O sistema opera como um ciclo de otimização autônomo. Um agente de IA recebe um script de treinamento e um orçamento computacional fixo (geralmente 5 minutos em uma GPU). A partir daí, ele lê seu próprio código-fonte, formula uma hipótese de melhoria, modifica o código, executa o experimento e avalia os resultados. Se a perda de validação, medida em bits por byte (val_bpb), melhora, a alteração é mantida; caso contrário, o agente tenta novamente. Em uma única noite, o agente de Karpathy realizou 126 experimentos, reduzindo a perda de 0,9979 para 0,9697. Após dois dias de ajuste, o agente processou cerca de 700 mudanças autônomas, encontrando melhorias que foram transferidas para modelos maiores, resultando em um ganho de eficiência de 11%.
Impactos Além da Ciência da Computação
Karpathy demonstrou que esse processo pode ser aplicado além da ciência da computação, abrangendo áreas como marketing e saúde. A postagem sobre o projeto no X viralizou rapidamente, acumulando mais de 8,6 milhões de visualizações em dois dias. Varun Mathur, CEO da plataforma de agregação de ferramentas de IA Hyperspace AI, levou o conceito do ciclo de Karpathy e o distribuiu em uma rede peer-to-peer. Nessa rede, cada nó tornou-se um pesquisador autônomo, executando centenas de experimentos sem supervisão.
- Diversidade de Hardware como Recurso: Enquanto GPUs potentes usavam força bruta, agentes em laptops focavam em estratégias de inicialização e escolhas de normalização.
- Descoberta Baseada em Gossip: Usando o protocolo GossipSub, agentes compartilhavam descobertas em tempo real, permitindo que melhorias se espalhassem rapidamente.
- Compressão da História: Em apenas 17 horas, os agentes redescobriram marcos da ML que levaram anos para serem formalizados por humanos.
Uma Revolução no Marketing
Enquanto especialistas em ML focavam nas curvas de perda, o mundo dos negócios viu uma revolução diferente. Eric Siu, fundador da agência Single Grain, aplicou o autoresearch ao “Ciclo de Experimentos” de marketing. Ele prevê que equipes de marketing poderão realizar 36.500 experimentos por ano, comparado aos 30 tradicionais, criando um mapa proprietário do que ressoa com o público.
Discussões e Desafios da Comunidade
Apesar do entusiasmo, a comunidade levantou preocupações no GitHub. Entre elas, o risco de “superotimização” e os reais significados dos ganhos obtidos. No entanto, Karpathy argumenta que o foco é em ganhos reais de desempenho por computação.
Conclusão: O Futuro da Pesquisa Automatizada
O lançamento do autoresearch sugere um futuro onde a função humana se transforma de experimentador para designer experimental. Com a emergência de ferramentas para apoiar essa evolução, o progresso da IA deixa de depender da capacidade humana de codificar e passa a depender da nossa habilidade de definir restrições de busca. Karpathy não está apenas codificando modelos; ele está plantando ecossistemas que aprendem enquanto dormimos.
