A Alibaba lança modelos compactos Qwen 3.5 que funcionam diretamente em laptops e superam os equivalentes da OpenAI.

A Alibaba lança modelos compactos Qwen 3.5 que funcionam diretamente em laptops e superam os equivalentes da OpenAI.

10 hardware

Alibaba Qwen 3.5 — nova série de modelos compactos de IA

No âmbito da sua divisão de inteligência artificial, a Alibaba anunciou o lançamento da linha de modelos Qwen 3.5, que prometem “pequeno tamanho + alta eficiência”. Em comparação com os equivalentes americanos, eles demonstram maior precisão com menor consumo de memória.

ModeloTamanhoCaracterísticas principais
Qwen 3.5‑0.8B0,8 bilhões de parâmetros“Miniatura” e “rápida”, destinada a protótipos e dispositivos móveis com autonomia limitada
Qwen 3.5‑2B2 bilhõesSemelhante ao 0.8B, mas um pouco mais potente
Qwen 3.5‑4B4 bilhõesMultimodal, janela de contexto de 262 144 tokens; adequado para soluções leves de agente
Qwen 3.5‑9B9 bilhõesCapaz de raciocinar, supera o OpenAI gpt‑oss‑120B (13,5× mais parâmetros) e demonstra nível de pós-graduação em pensamento lógico

Todos os modelos estão disponíveis sob a licença Apache 2.0, permitindo seu uso em projetos comerciais e re-treinamento conforme necessário.

O que há de novo na arquitetura?

A Alibaba abandonou os Transformers clássicos e adotou uma abordagem híbrida:

* Gated Delta Networks (GDN) – garantem alta taxa de transferência e baixa latência.
* Mixture‑of‑Experts (MoE) – resolvem o problema da memória limitada, típico de modelos pequenos.

Com isso, o Qwen 3.5 pode lidar com tokens multimodais simultaneamente, em vez de “anexar” geradores de imagens a modelos textuais como nas gerações anteriores. Como resultado, as versões 4B e 9B reconhecem elementos da interface do usuário (UI) e contam objetos em vídeo.

Testes e resultados

BenchmarkQwen 3.5‑9B
MMMU‑Pro (visual)70,1 % – superou o Google Gemini 2.5 Flash‑Lite (59,7) e o Qwen 3‑VL‑30B‑A3B (63,0)
Lógica81,7 % – maior que o OpenAI gpt‑oss‑120B (80,1), embora este tenha 10× mais parâmetros
HMMT Feb 2025 (matemática)83,2 % (9B), 74,0 % (4B) – demonstra que tarefas de ciências exatas não exigem recursos gigantescos na nuvem
OmniDocBench v1.5887,7 % – líder entre todas as modelos
MMMLU (multilíngue)81,2 % – superou o gpt‑oss‑120B (78,2 %)

Por que isso importa?

O surgimento do Qwen 3.5 coincidiu com o aumento da demanda por agentes de IA autônomos. O usuário moderno exige não apenas chatbots, mas sistemas que:

1. Pensem – raciocinem sobre problemas.
2. Vejam – processem imagens, vídeos e elementos UI.
3. Agam – saibam usar ferramentas (preencher formulários, organizar arquivos).

Considerando que modelos grandes (três a cinco bilhões de parâmetros) são caros em operação, o Qwen 3.5 oferece uma solução mais econômica. Os modelos podem ser executados localmente sem conexão à nuvem ou API, e o aprendizado por reforço permite decisões “humanas” – por exemplo, organizar a área de trabalho ou gerar código a partir de gravações de vídeo.

Aplicações práticas

* Dispositivos móveis – 0,8 bilhões de parâmetros cabem facilmente em smartphones e garantem operação autônoma.
* Estações de trabalho – 9 bilhões de parâmetros fornecem um conjunto completo de funcionalidades de agente IA sem nuvem.
* Agências de interface – graças à “acoplamento a nível de pixel”, os modelos podem navegar na UI, preencher formulários e organizar arquivos, executando comandos simples em linguagem natural com precisão de cerca de 90 %.

Assim, o Alibaba Qwen 3.5 abre caminho para agentes de IA mais acessíveis, flexíveis e poderosos, capazes de operar tanto na nuvem quanto localmente, atendendo às crescentes exigências do usuário moderno.

Comentários (0)

Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.

Ainda não há comentários. Deixe um comentário e compartilhe sua opinião!

Para deixar um comentário, faça login.

Faça login para comentar