A Alibaba lançou seu mais recente modelo de inteligência artificial, o Qwen3.5, em um movimento estratégico que coincide com o Ano Novo Lunar. Este novo modelo, identificado como Qwen3.5-397B-A17B, possui impressionantes 397 bilhões de parâmetros totais, mas ativa apenas 17 bilhões por token. Essa inovação está sendo destacada por superar seu antecessor, o Qwen3-Max, que já passava de um trilhão de parâmetros.
O desenvolvimento do Qwen3.5 baseia-se em sua linhagem, sucedendo o Qwen3-Next, um modelo MoE (Mixture of Experts) ultra-esparso. O novo lançamento aumenta de 128 para 512 especialistas, melhorando significativamente a latência de inferência. Com apenas 17 bilhões de parâmetros ativos por execução, a pegada computacional se aproxima de um modelo denso de 17B ao invés de um de 400B, permitindo raciocínios especializados mais eficientes.
Diferente das abordagens tradicionais que adaptam um codificador visual a um modelo de linguagem já existente, o Qwen3.5 foi treinado simultaneamente em texto, imagens e vídeos. Isso resulta em um modelo que possui raciocínio visual integrado de forma nativa, superando modelos adaptados em tarefas que combinam texto e imagem.
O Qwen3.5 amplia significativamente seu alcance multilinguístico, com um vocabulário que foi expandido de 150k para 250k tokens, comparável ao tokenizador de ~256K do Google. Isso não só melhora a eficiência no codificação de scripts não-latinos, mas também reduz a contagem de tokens em 15-40%, dependendo da língua.
A Alibaba posiciona o Qwen3.5 como um modelo agente, capaz de executar ações autônomas em nome dos usuários. Uma interface de linha de comando chamada Qwen Code permite que desenvolvedores deleguem tarefas complexas de codificação ao modelo usando linguagem natural. A compatibilidade com o OpenClaw, um framework agente de código aberto, é outro destaque, tornando o modelo mais adaptável a diversas aplicações empresariais.
Executar o Qwen3.5 em um ambiente interno requer hardware robusto, com uma versão quantizada demandando cerca de 256GB de RAM. Entretanto, ele oferece uma alternativa atraente para implantações dependentes de API, sendo disponibilizado sob a licença Apache 2.0, que permite uso comercial e modificação sem restrições significativas.
A Alibaba demonstrou que modelos open-weight na vanguarda já não são um compromisso. O Qwen3.5 se apresenta como uma opção viável para equipes que buscam capacidades multimodais nativas e um amplo contexto de 1 milhão de tokens, sem a necessidade de uma API proprietária. O modelo está disponível no Hugging Face e no Alibaba Cloud Model Studio, com acesso público gratuito para avaliação no Qwen Chat. Para as empresas, a questão agora é se suas infraestruturas estão preparadas para aproveitar essa nova onda de inovação em IA.
Aproveite a atualização Cold Snap em Arc Raiders com novos mapas e desafios até 13…
Atualização Arc Raiders traz eventos, funções e ajustes esperados. Confira as novidades e otimize sua…
A verdade sobre a morte de Peter Greene foi revelada. Saiba mais sobre o trágico…
Todd Howard revela atualização empolgante para Starfield. Fãs aguardam ansiosos por melhorias e novos conteúdos.…
Explore como a LexisNexis transforma a IA jurídica com grafos RAG e agentes inovadores, melhorando…
Conheça Tilly Ramsay, a nova chef que trilha seu próprio caminho na culinária. Assista sua…