A equipe de desenvolvimento da inteligência artificial da Alibaba, agora famosa por suas inovações, surpreendeu novamente ao lançar a série Qwen3.5 Medium Model. Essa nova série inclui quatro grandes modelos de linguagem, com suporte para chamadas de ferramentas agenticas. Três desses modelos estão disponíveis para uso comercial sob licença Apache 2.0, padrão do código aberto:
Os desenvolvedores podem baixar esses modelos agora mesmo no Hugging Face e ModelScope. O quarto modelo, Qwen3.5-Flash, é proprietário e está disponível apenas através da API do Alibaba Cloud Model Studio, mas oferece uma vantagem significativa em custo comparado a outros modelos ocidentais.
Os modelos de código aberto da Qwen oferecem um desempenho comparável aos benchmark de terceiros, superando modelos proprietários de startups americanas como OpenAI e Anthropic. O Qwen3.5 foi projetado para manter alta precisão mesmo quando “quantizado”, um processo que reduz significativamente seu tamanho.
Essa inovação traz janelas de contexto em nível de fronteira para PCs comuns. O modelo carro-chefe, Qwen3.5-35B-A3B, pode exceder um comprimento de contexto de 1 milhão de tokens em GPUs de consumidor com 32GB de VRAM, algo antes impensável sem infraestrutura de servidor.
No coração do desempenho do Qwen 3.5 está uma sofisticada arquitetura híbrida. Enquanto muitos modelos dependem apenas de blocos Transformer padrão, o Qwen 3.5 integra Redes Delta com Portas combinadas com um sistema Mixture-of-Experts (MoE) esparso.
O Qwen 3.5 introduz um “Modo de Pensamento” nativo, gerando uma cadeia de raciocínio interna antes de fornecer uma resposta final, melhorando a resolução de lógicas complexas.
Para aqueles que não hospedam seus próprios pesos, o Alibaba Cloud Model Studio oferece uma API competitiva para o Qwen3.5-Flash:
O modelo de preços do Tool Calling também é granular, com Pesquisa na Web a $10 por 1.000 chamadas e o Code Interpreter gratuito por tempo limitado.
Com o lançamento dos Modelos Qwen3.5 Medium, a iteração rápida e o ajuste fino, outrora reservados para laboratórios bem financiados, agora estão acessíveis para o desenvolvimento local em diversas empresas. Isso transforma a forma como os dados são manipulados e protegidos, permitindo uma análise institucional profunda sem os riscos de privacidade de APIs de terceiros.
Essa mudança para a eficiência arquitetural, em vez de escala bruta, garante que a integração de IA permaneça consciente dos custos, segura e ágil o suficiente para acompanhar as necessidades operacionais em evolução.
God of War: Laufey traz Faye como protagonista em Jötunheim, revelando uma narrativa rica e…
Haru, filha de Tablo, faz estreia como tradutora de filme aos 16 anos enquanto se…
BTS V responde a polêmica sobre histórias de seu colega de serviço militar, gerando reações…
Descubra os novos jogos do Xbox Game Pass em junho: ação, aventura e RPGs imperdíveis…
Kim Myung Soo e Kang Min Ah destacam-se na leitura de roteiro do drama 'Empathy…
Encontre e use os fragmentos de medalhão em Disney Dreamlight Valley para desbloquear Phil e…