A IA demonstrou baixa eficácia nas apostas esportivas, perdendo todo o dinheiro em partidas da Premier League inglesa.

A IA demonstrou baixa eficácia nas apostas esportivas, perdendo todo o dinheiro em partidas da Premier League inglesa.

2 hardware

Breve sobre os resultados do experimento

A startup *General Reasoning* conduziu um teste chamado KellyBench, no qual avaliou oito principais sistemas de IA (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 e outros) quanto à capacidade de fazer apostas durante a temporada da Premier League inglesa 2023–2024.

Cada agente recebeu uma descrição estatística completa de todas as equipes e partidas anteriores, mas o acesso à internet estava proibido – os modelos só puderam usar os dados que receberam antecipadamente.

Como foi conduzido o teste

1. Três tentativas: cada sistema podia fazer três séries de apostas ao longo da temporada.
2. Apostas: nos resultados dos jogos (vitória/empate/perda) e na quantidade de gols.
3. Objetivo: maximizar o lucro, gerenciando os riscos.

Quem venceu e quem perdeu

Sistema de IAResultado médioObservação
Anthropic Claude Opus 4.611 % (aproximadamente break‑even em uma tentativa)O participante “mais honesto”, mas ainda assim perdeu dinheiro
Google Gemini 3.1 Pro+34 % na primeira tentativa, depois falhouLucro inicial, depois prejuízo
xAI Grok 4.20Falhou imediatamente, não completou as duas tentativas seguintesO mais fraco de todos

No final, cada modelo perdeu dinheiro ao longo da temporada, e alguns até “falharam” completamente. Isso confirma as conclusões dos pesquisadores: mesmo os sistemas de IA mais avançados enfrentam dificuldades com previsões de longo prazo no mundo real.

O que isso significa para o futuro da IA

- As preocupações sobre a substituição do ser humano ainda parecem exageradas.
- Os benchmarks atuais costumam usar condições “estáticas”, que não refletem o caos e a complexidade da vida real.
- Embora a IA já resolva com sucesso tarefas como escrever código, na maioria das outras áreas de atividade humana ela permanece limitada.

Assim, o experimento KellyBench demonstra que a IA ainda não está pronta para competir com humanos em tarefas dinâmicas e imprevisíveis, como previsões esportivas.

Comentários (0)

Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.

Ainda não há comentários. Deixe um comentário e compartilhe sua opinião!

Para deixar um comentário, faça login.

Faça login para comentar