O Google anunciou o Gemini 3.1 Flash‑Lite como “o representante mais rápido e energeticamente eficiente de sua linha”.

O Google anunciou o Gemini 3.1 Flash‑Lite como “o representante mais rápido e energeticamente eficiente de sua linha”.

14 software

Google apresenta o Gemini 3.1 Flash‑Lite – modelo de IA econômico e rápido

A Google anunciou o lançamento da nova versão do modelo Gemini 3.1 Flash‑Lite, que se posiciona como o mais acessível na linha Gemini em termos de custo e desempenho.

* Otimização para grandes dados – algoritmo especialmente ajustado para processar eficientemente conjuntos extensos de informações.
* Custo de uso – US$ 0,25 por milhão de tokens de entrada e US$ 1,50 por milhão de tokens de saída.

Versão preliminar já disponível:

- para desenvolvedores via Gemini API no Google AI Studio;
- para clientes corporativos – no Vertex AI.

Velocidade e qualidade
IndicadorGemini 3.1 Flash‑LiteGemini 2.5 FlashTempo até o primeiro token 2,5× mais rápido—Taxa de resposta 45 % maior—Qualidade da resposta semelhante/maior—
Baixa latência torna o modelo especialmente atraente para aplicações em tempo real: desde chatbots até interfaces interativas que exigem respostas instantâneas.

Resultados dos testes
* Classificação ELO no Arena.ai – 1432 pontos.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.

Nesses testes, o Gemini 3.1 Flash‑Lite superou modelos de nível semelhante e até alguns predecessores maiores (por exemplo, Gemini 2.5 Flash) em raciocínio e processamento multimodal.

Flexibilidade e escalabilidade
Os desenvolvedores podem ajustar a profundidade de reflexão do modelo conforme suas necessidades – fator importante para cargas de trabalho de alta frequência.

O algoritmo está otimizado para:

- tradução de grandes volumes de texto;
- moderação de conteúdo, onde o custo é primordial.

Ele também se adequa à geração de interfaces de usuário (UI), painéis, modelagem e a condução de pesquisas baseadas em consultas complexas.

Em resumo: o Gemini 3.1 Flash‑Lite combina economia, velocidade e qualidade confiável, tornando-o uma ferramenta valiosa tanto para desenvolvedores individuais quanto para clientes corporativos que buscam soluções de IA com baixa latência e alto desempenho.

Comentários (0)

Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.

Ainda não há comentários. Deixe um comentário e compartilhe sua opinião!

Para deixar um comentário, faça login.

Faça login para comentar