O Google anunciou o Gemini 3.1 Flash‑Lite como “o representante mais rápido e energeticamente eficiente de sua linha”.
Google apresenta o Gemini 3.1 Flash‑Lite – modelo de IA econômico e rápido
A Google anunciou o lançamento da nova versão do modelo Gemini 3.1 Flash‑Lite, que se posiciona como o mais acessível na linha Gemini em termos de custo e desempenho.
* Otimização para grandes dados – algoritmo especialmente ajustado para processar eficientemente conjuntos extensos de informações.
* Custo de uso – US$ 0,25 por milhão de tokens de entrada e US$ 1,50 por milhão de tokens de saída.
Versão preliminar já disponível:
- para desenvolvedores via Gemini API no Google AI Studio;
- para clientes corporativos – no Vertex AI.
Velocidade e qualidade
IndicadorGemini 3.1 Flash‑LiteGemini 2.5 FlashTempo até o primeiro token 2,5× mais rápido—Taxa de resposta 45 % maior—Qualidade da resposta semelhante/maior—
Baixa latência torna o modelo especialmente atraente para aplicações em tempo real: desde chatbots até interfaces interativas que exigem respostas instantâneas.
Resultados dos testes
* Classificação ELO no Arena.ai – 1432 pontos.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.
Nesses testes, o Gemini 3.1 Flash‑Lite superou modelos de nível semelhante e até alguns predecessores maiores (por exemplo, Gemini 2.5 Flash) em raciocínio e processamento multimodal.
Flexibilidade e escalabilidade
Os desenvolvedores podem ajustar a profundidade de reflexão do modelo conforme suas necessidades – fator importante para cargas de trabalho de alta frequência.
O algoritmo está otimizado para:
- tradução de grandes volumes de texto;
- moderação de conteúdo, onde o custo é primordial.
Ele também se adequa à geração de interfaces de usuário (UI), painéis, modelagem e a condução de pesquisas baseadas em consultas complexas.
Em resumo: o Gemini 3.1 Flash‑Lite combina economia, velocidade e qualidade confiável, tornando-o uma ferramenta valiosa tanto para desenvolvedores individuais quanto para clientes corporativos que buscam soluções de IA com baixa latência e alto desempenho.
Comentários (0)
Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.
Faça login para comentar