Na última terça-feira, a Anthropic revelou o Claude Sonnet 4.6, um modelo que promete redefinir o preço da inteligência artificial no mercado. Oferecendo uma inteligência quase de ponta a um custo intermediário, ele chega em meio a uma corrida corporativa sem precedentes para o uso de agentes de IA e ferramentas automatizadas de codificação.
O Sonnet 4.6 representa uma atualização completa em áreas como codificação, uso de computador, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design. Uma novidade é a janela de contexto de 1 milhão de tokens em fase beta, agora padrão nos produtos Claude.ai e Claude Cowork, mantendo o preço de $3/$15 por milhão de tokens, similar ao seu antecessor, o Sonnet 4.5.
O aspecto econômico é a grande notícia. Os modelos Opus da Anthropic custam $15/$75 por milhão de tokens, cinco vezes mais que o Sonnet. Entretanto, o Sonnet 4.6 oferece desempenho em tarefas reais que antes exigiam um modelo da classe Opus, mudando a matemática para empresas que fazem milhões de chamadas de API diariamente.
A importância do lançamento do Sonnet 4.6 se destaca em um momento dominado pelos fenômenos de coding de ambiente e IA agentiva. Claude Code, a ferramenta voltada para desenvolvedores da Anthropic, tornou-se uma força cultural no Vale do Silício, permitindo que engenheiros construam aplicativos inteiros através de conversas em linguagem natural.
Os modelos de IA agora são avaliados como motores de agentes autônomos — sistemas que operam por horas, realizam milhares de chamadas, escrevem e executam códigos, navegam em navegadores e interagem com softwares empresariais. A diferença entre gastar $15 e $3 por milhão de tokens de entrada é transformacional em larga escala.
Os resultados dos testes de benchmark mostram que o Sonnet 4.6 rivaliza ou supera modelos que custam cinco vezes mais. No SWE-bench Verified, uma referência para codificação de software no mundo real, o Sonnet 4.6 alcançou 79,6%, quase igualando o Opus 4.6. Em análises financeiras, o Sonnet 4.6 obteve 63,3%, superando o Opus 4.6.
Nos testes iniciais, os usuários preferiram o Sonnet 4.6 ao Sonnet 4.5 em cerca de 70% das vezes, e ao Opus 4.5 em 59% das vezes, destacando menos propensão a superengenharia e melhor seguimento de instruções.
O progresso da Anthropic no uso de computadores é impressionante. A capacidade de uma IA operar um computador como um humano — clicando, digitando e navegando em software sem APIs modernas — melhorou quase cinco vezes em 16 meses, com o Sonnet 4.6 alcançando 72,5% no OSWorld.
A segurança ganhou atenção, com melhorias significativas na resistência a ataques de injeção de prompts. Isso é crucial para empresas que implementam agentes de IA que navegam na web e interagem com sistemas externos.
O Claude Sonnet 4.6 está redefinindo o equilíbrio entre custo e desempenho, possibilitando que empresas utilizem inteligência de classe Opus sem os custos elevados. Com aplicações em diversas áreas, desde a codificação até a análise financeira, o Sonnet 4.6 emerge como uma força transformadora no campo da inteligência artificial.
Veja Jeon Seok Ho em 'Phantom Lawyer', um drama jurídico cativante e emocionante. Acompanhe os…
Explore contrastes do amor em Love Phobia da U+tv com Yeonwoo e Kim Hyun Jin.…
Atualização Luna 4 de Genshin Impact chega em janeiro com personagens inéditos e eventos empolgantes.…
Amplie o espaço do seu Nintendo Switch 2 com Samsung P9 MicroSD em promoção. Aproveite…
Chris Hemsworth revela novas oportunidades para Thor no UCM. Prepare-se para surpresas e aventuras épicas!…
McKenna Grace como Daphne na nova série Scooby-Doo. Aventure-se nessa produção Netflix! Saiba mais.