O Google lançou o Gemini 3 Deep Think — um serviço de IA avançado para tarefas científicas que continua “ajustando” as respostas às solicitações.
Google lançou a versão atualizada do Gemini 3 Deep Think
A empresa Google anunciou uma grande atualização de sua plataforma Gemini 3 Deep Think – inteligência artificial capaz de raciocinar e resolver tarefas complexas de ciência e engenharia.
O que mudou
Parâmetro | Novo | Como fica | Objetivo
---|---|---|---
Passar da teoria pura para a aplicação prática | Resolver problemas sem restrições claras, com dados incompletos | Disponível no aplicativo Gemini | Assinantes do Google AI Ultra podem usar; via API – engenheiros e empresas (solicitação necessária) | Parceiros de desenvolvimento: cientistas pesquisadores | Colaboração em tarefas complexas
Indicadores de desempenho
Teste | Resultado | Comentário
---|---|---
Humanity’s Last Exam | 48,4 % | Sem ferramentas externas
ARC‑AGI‑284 | 6,5 % | Benchmark para assistentes de IA
Codeforces (Elo) | 3455 | Alta classificação entre soluções de software
IMO 2025 | Medalha de ouro | Equivalente ao nível dos participantes da Olimpíada Internacional
Química/Física | Mesmo resultado | Mostrou versatilidade em diferentes disciplinas
CMT‑Benchmark (física teórica) | 50,5 % | Boa compreensão de conceitos complexos
Agente IA “Aletheia”
No laboratório DeepMind do Google, criaram o agente Aletheia baseado no Gemini 3 Deep Think. Características principais:
1. Verificação de hipóteses – o agente identifica fraquezas nas soluções propostas e as corrige iterativamente.
2. Reconhecimento de incerteza – pode indicar que não sabe a resposta.
3. Interação com fontes externas – usa o serviço de busca do Google e navegação web, mas evita inventar links.
Níveis de realização
O Google dividiu os sucessos da Aletheia em cinco estágios:
| Estágio | Descrição | Exemplos |
|---|---|---|
| 0 – “pequena novidade” | Modo totalmente autônomo, três problemas de P. Erdős resolvidos (primeiro nível) | Três problemas Erdős |
| 1 – “mínima novidade” | Um resultado adicional em modo autônomo | Quarto problema |
| 2 – “pronto para publicação” | Resultados tanto autônomos quanto colaborativos com humanos, além de ferramentas auxiliares | Dados dos problemas 3–4 – “avanço significativo/notável” |
Como a Aletheia lida com os problemas de Erdős
* De 700 problemas ainda não resolvidos pelo agente, foram solucionados 13.
* No entanto, apenas 4 são realmente novos – os demais já são conhecidos na comunidade científica.
* Entre as 212 soluções apresentadas, apenas 6,5 % foram substancialmente corretas; 68,5 % continham erros fundamentais, e 31,5 % interpretaram mal o problema.
Os desenvolvedores observam que a IA tende a “reinterpretar a pergunta de forma a responder mais facilmente”, permanecendo “altamente suscetível a erros em comparação com humanos”. Assim, ainda não é possível substituir matemáticos por inteligência artificial.
Resumo: Gemini 3 Deep Think e seu agente Aletheia demonstram resultados impressionantes em diversas áreas da ciência, mas mantêm limitações significativas de precisão e confiabilidade nas soluções. O Google continua trabalhando para aprimorar a capacidade de raciocínio profundo e verificação das próprias conclusões da IA.
Comentários (0)
Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.
Faça login para comentar