A Alibaba lança modelos compactos Qwen 3.5 que funcionam diretamente em laptops e superam os equivalentes da OpenAI.
Alibaba Qwen 3.5 — nova série de modelos compactos de IA
No âmbito da sua divisão de inteligência artificial, a Alibaba anunciou o lançamento da linha de modelos Qwen 3.5, que prometem “pequeno tamanho + alta eficiência”. Em comparação com os equivalentes americanos, eles demonstram maior precisão com menor consumo de memória.
| Modelo | Tamanho | Características principais |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 bilhões de parâmetros | “Miniatura” e “rápida”, destinada a protótipos e dispositivos móveis com autonomia limitada |
| Qwen 3.5‑2B | 2 bilhões | Semelhante ao 0.8B, mas um pouco mais potente |
| Qwen 3.5‑4B | 4 bilhões | Multimodal, janela de contexto de 262 144 tokens; adequado para soluções leves de agente |
| Qwen 3.5‑9B | 9 bilhões | Capaz de raciocinar, supera o OpenAI gpt‑oss‑120B (13,5× mais parâmetros) e demonstra nível de pós-graduação em pensamento lógico |
Todos os modelos estão disponíveis sob a licença Apache 2.0, permitindo seu uso em projetos comerciais e re-treinamento conforme necessário.
O que há de novo na arquitetura?
A Alibaba abandonou os Transformers clássicos e adotou uma abordagem híbrida:
* Gated Delta Networks (GDN) – garantem alta taxa de transferência e baixa latência.
* Mixture‑of‑Experts (MoE) – resolvem o problema da memória limitada, típico de modelos pequenos.
Com isso, o Qwen 3.5 pode lidar com tokens multimodais simultaneamente, em vez de “anexar” geradores de imagens a modelos textuais como nas gerações anteriores. Como resultado, as versões 4B e 9B reconhecem elementos da interface do usuário (UI) e contam objetos em vídeo.
Testes e resultados
| Benchmark | Qwen 3.5‑9B |
|---|---|
| MMMU‑Pro (visual) | 70,1 % – superou o Google Gemini 2.5 Flash‑Lite (59,7) e o Qwen 3‑VL‑30B‑A3B (63,0) |
| Lógica | 81,7 % – maior que o OpenAI gpt‑oss‑120B (80,1), embora este tenha 10× mais parâmetros |
| HMMT Feb 2025 (matemática) | 83,2 % (9B), 74,0 % (4B) – demonstra que tarefas de ciências exatas não exigem recursos gigantescos na nuvem |
| OmniDocBench v1.58 | 87,7 % – líder entre todas as modelos |
| MMMLU (multilíngue) | 81,2 % – superou o gpt‑oss‑120B (78,2 %) |
Por que isso importa?
O surgimento do Qwen 3.5 coincidiu com o aumento da demanda por agentes de IA autônomos. O usuário moderno exige não apenas chatbots, mas sistemas que:
1. Pensem – raciocinem sobre problemas.
2. Vejam – processem imagens, vídeos e elementos UI.
3. Agam – saibam usar ferramentas (preencher formulários, organizar arquivos).
Considerando que modelos grandes (três a cinco bilhões de parâmetros) são caros em operação, o Qwen 3.5 oferece uma solução mais econômica. Os modelos podem ser executados localmente sem conexão à nuvem ou API, e o aprendizado por reforço permite decisões “humanas” – por exemplo, organizar a área de trabalho ou gerar código a partir de gravações de vídeo.
Aplicações práticas
* Dispositivos móveis – 0,8 bilhões de parâmetros cabem facilmente em smartphones e garantem operação autônoma.
* Estações de trabalho – 9 bilhões de parâmetros fornecem um conjunto completo de funcionalidades de agente IA sem nuvem.
* Agências de interface – graças à “acoplamento a nível de pixel”, os modelos podem navegar na UI, preencher formulários e organizar arquivos, executando comandos simples em linguagem natural com precisão de cerca de 90 %.
Assim, o Alibaba Qwen 3.5 abre caminho para agentes de IA mais acessíveis, flexíveis e poderosos, capazes de operar tanto na nuvem quanto localmente, atendendo às crescentes exigências do usuário moderno.
Comentários (0)
Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.
Faça login para comentar