Quando um analista de finanças da OpenAI precisava comparar receitas por regiões geográficas e grupos de clientes no ano passado, a tarefa levava horas. Era preciso vasculhar 70 mil conjuntos de dados, escrever consultas SQL e verificar esquemas de tabelas. Hoje, esse mesmo analista digita uma pergunta em inglês simples no Slack e obtém um gráfico pronto em minutos.
Essa revolução foi possível graças a uma ferramenta desenvolvida por dois engenheiros em apenas três meses, com 70% do código criado por inteligência artificial. Agora, é usada diariamente por milhares de funcionários da OpenAI, representando uma das implementações mais agressivas de um agente de dados de IA dentro de qualquer empresa.
Emma Tang, chefe de infraestrutura de dados na OpenAI, revelou em uma entrevista exclusiva como o sistema funciona, onde falha e o que sinaliza sobre o futuro dos dados corporativos. A conversa, combinada com um post no blog da empresa, destaca que o obstáculo para organizações mais inteligentes não são modelos melhores, mas dados melhores.
A plataforma de dados da OpenAI abrange mais de 600 petabytes em 70 mil conjuntos de dados. Encontrar a tabela correta pode consumir horas do tempo de um cientista de dados. A equipe de Tang, responsável por sistemas de big data e ferramentas de dados, atende uma vasta base de usuários internos. “São 5 mil funcionários na OpenAI agora”, disse Tang, “mais de 4 mil usam ferramentas de dados que nossa equipe fornece”.
O agente, baseado no GPT-5.2 e acessível via Slack, interface web, IDEs, Codex CLI e o aplicativo interno ChatGPT, aceita perguntas em inglês simples e retorna gráficos, dashboards e relatórios analíticos detalhados. Segundo estimativas da equipe, ele economiza de duas a quatro horas de trabalho por consulta. Mas o ganho maior é mais difícil de medir: o agente oferece acesso a análises que antes eram impossíveis.
Tang descreveu casos de uso que demonstram o alcance do agente. Equipes de finanças da OpenAI o utilizam para comparações de receita. A verdadeira potência está na análise estratégica, multi-etapas. Em um caso, um usuário identificou discrepâncias entre dois dashboards de crescimento de assinantes, algo que levaria horas para humanos, mas que o agente resolve em minutos.
Encontrar a tabela certa entre 70 mil conjuntos de dados é o maior desafio técnico, segundo Tang. É onde o Codex, agente de codificação da OpenAI, desempenha um papel crucial. O Codex realiza um processo diário assíncrono, examinando tabelas de dados importantes e determinando dependências e similaridades entre tabelas.
O agente usa seis camadas de contexto, desde metadados básicos até conhecimento institucional. Um dos maiores problemas é a autoconfiança excessiva do modelo. A solução veio através de engenharia de prompts que força o agente a passar mais tempo na fase de descoberta.
O feedback do usuário fecha o ciclo. Funcionários sinalizam resultados incorretos diretamente, e a equipe investiga. O modelo também realiza uma autoavaliação após cada tarefa. Em termos de segurança, controles de acesso fortes são fundamentais, com o agente operando apenas em canais privados ou na interface do usuário.
Apesar do potencial comercial, a OpenAI não tem planos de comercializar seu agente de dados interno. A estratégia é fornecer blocos de construção para que as empresas construam suas próprias soluções. “Usamos todas as mesmas APIs disponíveis externamente”, disse Tang.
Tang destacou a importância da governança de dados para o funcionamento eficaz de agentes de dados. “Seu dados precisam ser limpos e anotados adequadamente, e deve haver uma fonte de verdade para o agente explorar”, afirmou.
Empresas que adotarem essa tecnologia verão os benefícios rapidamente, enquanto aquelas que hesitarem podem ficar para trás. A infraestrutura subjacente ainda é necessária, mas o agente representa um novo ponto de entrada para a inteligência de dados, mais autônomo e acessível do que qualquer coisa anterior.
Yumi's Cells retorna em 13 de abril na TVING. Acompanhe Yumi, agora uma autora de…
Jung Kyung Ho enfrenta andropausa precoce em 'Unshakable Forties' Romance', desafiando expectativas de estabilidade.
Yeon Sang Ho retorna com 'Colony', estrelando Jun Ji Hyun após 11 anos. Um thriller…
Modelo Phi-4 da Microsoft desafia gigantes com eficiência e menos recursos, disponível no HuggingFace e…
Self-Flow da Black Forest Labs elimina gargalos de IA, convergindo 2,8x mais rápido que métodos…
Han Sun Ho e Yoon Bi Ah enfrentam desafios emocionais e tecnológicos em 'Love Phobia'.…