A OpenAI lançou o Codex Security no dia 6 de março, entrando no mercado de segurança de aplicações que a Anthropic havia sacudido 14 dias antes com o Claude Code Security. Ambos os scanners utilizam raciocínio de Modelos de Linguagem de Grande Escala (LLM) ao invés de corresponder padrões. Eles demonstraram que ferramentas tradicionais de testes de segurança estática de aplicações (SAST) são estruturalmente cegas para classes inteiras de vulnerabilidades.
Tanto a Anthropic quanto a OpenAI lançaram scanners baseados em raciocínio de forma independente, descobrindo classes de bugs que o SAST tradicional não foi projetado para detectar. A pressão competitiva entre os dois laboratórios, com uma avaliação de mercado privado combinada que supera US$ 1,1 trilhão, significa que a qualidade de detecção melhorará mais rápido do que qualquer fornecedor poderia entregar sozinho.
A Anthropic publicou sua pesquisa de zero-day em 5 de fevereiro junto com o lançamento do Claude Opus 4.6, revelando mais de 500 vulnerabilidades de alta severidade anteriormente desconhecidas em códigos abertos que passaram por décadas de revisão. Claude encontrou um estouro de buffer no heap ao raciocinar sobre o algoritmo LZW, uma falha que a fuzzing guiada por cobertura não conseguiu pegar. Por outro lado, a OpenAI desenvolveu o Codex Security a partir do Aardvark, uma ferramenta interna alimentada pelo GPT-5. Durante o período beta, o agente da OpenAI escaneou mais de 1,2 milhão de commits, revelando 792 descobertas críticas e 10.561 de alta severidade.
Pesquisadores da Checkmarx Zero demonstraram que vulnerabilidades moderadamente complicadas às vezes escapam da detecção do Claude Code Security. Um escaneamento de base de código em produção mostrou que, das oito vulnerabilidades identificadas, apenas duas eram verdadeiros positivos. Nem a Anthropic nem a OpenAI submeteram suas alegações de detecção a uma auditoria independente. Merritt Baer, CSO na Enkrypt AI, recomenda que equipes de segurança priorizem patches com base na exploração no contexto de execução, em vez de apenas nos escores CVSS. Isso encurta a janela entre descoberta, triagem e correção, mantendo a visibilidade do software.
O avanço técnico representado por essas ferramentas de raciocínio em código destaca um ponto crítico na segurança de aplicações. A vantagem competitiva entre a Anthropic e a OpenAI está acelerando o ritmo de inovação, forçando uma reavaliação das estratégias de segurança atuais. O uso de scanners baseados em raciocínio, agora disponíveis gratuitamente para clientes corporativos, está alterando permanentemente a matemática de aquisição de segurança. À medida que a tecnologia avança, a segurança não deve apenas se adaptar, mas também antecipar as novas ameaças que surgem com essas inovações. As organizações devem estar prontas para integrar essas ferramentas em suas pilhas de segurança existentes, garantindo que a detecção e correção de vulnerabilidades acompanhem o ritmo acelerado da inovação tecnológica.
Desafios do LinkedIn revelados: Mini Sudoku, Zip, Tango e mais para 11 de março de…
Desbloqueie recompensas valiosas no WWE 2K26 com códigos de locker temporários. Aproveite antes que expirem!
A Netflix traz Samurai Champloo à vida com a Tomorrow Studios, prometendo fidelidade ao anime…
BTS aumenta público para 22.000 no concerto em Seul, marcando seu retorno após serviço militar.
Odd Atelier adota medidas legais severas para defender Jennie de rumores e difamações online.
11,7 milhões já assistiram 'The King’s Warden', mas acusações de plágio desafiam sua originalidade.