O complexo Anthropic Claude, composto por 16 agentes de IA, criou de forma autossuficiente um compilador em C.
No âmbito do experimento, a empresa Anthropic reuniu um grupo de 16 agentes autônomos de IA que criaram em conjunto, do zero, um compilador da linguagem C em Rust. O resultado é uma implementação “pura” capaz de compilar o núcleo Linux 6.19 e projetos como PostgreSQL, SQLite, Redis, FFmpeg e QEMU, mas permanece significativamente atrás do GCC em qualidade e eficiência.
Como foi feito
Etapa | O que aconteceu
---|---
Preparação | 16 instâncias do modelo Claude Opus 4.6 foram iniciadas em contêineres Docker separados sem acesso à Internet. Cada uma clonou o repositório Git comum e recebeu tarefas através de arquivos lock.
Planejamento independente | Não há coordenador central: cada agente decide sozinho qual “pedaço óbvio” de trabalho executar a seguir. Em caso de conflito, os códigos são mesclados automaticamente.
Desenvolvimento | Os agentes foram encarregados de escrever o compilador C do zero. O trabalho durou 2 semanas e exigiu quase 2000 sessões do Claude Code.
Teste | Para não “poluir” o contexto do modelo com consultas longas, os testes são executados em modo resumo (apenas algumas linhas de saída). Para acelerar, foi adicionado um modo rápido que processa apenas 1–10 % dos testes.
Produto final
* Volume – cerca de 100 000 linhas de código Rust.
* Funcionalidade – pode compilar o núcleo Linux 6.19 em x86, ARM e RISC‑V; compila PostgreSQL, SQLite, Redis, FFmpeg, QEMU; passa ~99 % dos testes do GCC.
* Limitações – não gera código máquina de 16 bits (para executar Linux é necessário GCC), o assembler e linker apresentam erros, e a performance do código é inferior à do GCC. A qualidade do Rust gerado deixa a desejar em comparação com um programador experiente.
Custo do experimento
Indicador | Custo
---|---
Tokens Claude API | ~US$20 000
Custos adicionais (treinamento de modelo, organização do projeto, conjuntos de teste) | Não incluídos no valor indicado
Lições e conclusões
1. Limite da autonomia – ao crescer o código para cerca de 100 000 linhas, os agentes deixam de compreender totalmente o projeto; isso parece ser o limite superior para IA autônoma.
2. Necessidade de suporte – tentativas de ampliar a funcionalidade frequentemente quebravam partes já funcionando do código.
3. Importância do ambiente de desenvolvimento – isolamento da internet e configuração adequada dos testes foram críticos para a estabilidade dos agentes.
Conclusão
O experimento demonstra que modelos de IA modernos são capazes de gerar sistemas de software complexos com controle mínimo. No entanto, ainda não podem substituir completamente desenvolvedores experientes: qualidade do código, desempenho e confiabilidade permanecem abaixo dos compiladores tradicionais, e o escopo do projeto está limitado a centenas de milhares de linhas. É um passo importante à frente, mas ainda longe da produção totalmente autônoma de software.
Comentários (0)
Compartilhe sua opinião — por favor, seja educado e mantenha-se no tema.
Faça login para comentar