No dinâmico universo dos modelos de linguagem, a Mistral Small 4 surge como uma proposta atraente para empresas que buscam unificar tarefas de raciocínio, multimodais e codificação agentiva em um único modelo open-source. Este novo modelo oferece níveis de raciocínio ajustáveis, prometendo simplificar a pilha tecnológica de muitas organizações.
A Mistral Small 4 entra em cena para competir em um campo já lotado de modelos compactos, como Qwen e Claude Haiku, que buscam se destacar pelo custo de inferência e desempenho em benchmarks. A grande promessa da Mistral é a produção de saídas mais curtas, resultando em menor latência e tokens mais baratos.
Atualizando a versão anterior, o Mistral Small 3.2, lançada em junho de 2025, a Small 4 está disponível sob a licença Apache 2.0. Segundo a Mistral, “com o Small 4, os usuários não precisam mais escolher entre um modelo rápido de instrução, um motor de raciocínio poderoso ou um assistente multimodal: agora, um único modelo entrega tudo isso, com esforço de raciocínio configurável e eficiência de classe mundial.”
Apesar de seu tamanho reduzido — com 119 bilhões de parâmetros totais e apenas 6 bilhões ativos por token —, a Small 4 combina as capacidades de todos os modelos da Mistral. Ela incorpora o raciocínio do Magistral, a compreensão multimodal do Pixtral e o desempenho de codificação agentiva do Devstral. A janela de contexto de 256K é ideal para conversas longas e análises detalhadas.
Rob May, co-fundador e CEO da Neurometric, destaca a flexibilidade arquitetural da Small 4. Entretanto, ele reconhece que a diversidade crescente de modelos pequenos pode confundir o mercado. “Do ponto de vista técnico, sim, ela pode ser competitiva contra outros modelos. O maior desafio é superar a confusão no mercado,” afirmou May.
A Small 4 é construída sobre uma arquitetura de mistura de especialistas, com 128 especialistas e quatro ativos por token, permitindo escalabilidade eficiente e especialização. Isso permite respostas rápidas, mesmo para saídas que exigem mais raciocínio. Além disso, o modelo processa e raciocina sobre texto e imagens, permitindo aos usuários analisar documentos e gráficos.
Nos benchmarks da Mistral, a Small 4 se aproxima dos níveis do Mistral Medium 3.1 e Mistral Large 3, especialmente no MMLU Pro. Seu desempenho em seguir instruções a torna ideal para tarefas empresariais de alto volume.
Apesar da competição acirrada, a Small 4 se destaca por produzir saídas significativamente mais curtas, o que se traduz em custos de inferência e latência menores. Em modo de instruções, suas saídas são as mais curtas entre os modelos testados.
A Mistral Small 4 apresenta-se como uma solução inovadora para empresas que buscam eficiência e versatilidade em modelos de linguagem. Com sua capacidade de ajustar o raciocínio e integração de múltiplas capacidades em um único modelo, ela promete otimizar operações e reduzir custos. No entanto, o verdadeiro teste será sua capacidade de se destacar em um mercado cada vez mais fragmentado e competitivo.
Arsenal enfrenta Manchester City na Carabao Cup, enquanto o Tyne-Wear derby retorna após uma década.
Ada Thorne é brutalmente assassinada por John Beckett, impactando Tommy Shelby em The Immortal Man.
Netflix transforma Powers em animação adulta com Bendis e Oeming; fãs aguardam ansiosos.
Buddy Daddies e Lazarus: animes curtos que emocionam e desafiam com ação e reflexão.
Zumbis e Vodou haitiano: descubra o impacto cultural em Black Zombie, dirigido por Maya Annik…
Dead Eyes combina Hardcore Henry e Blair Witch, prometendo ser o mais assustador dos últimos…