Anthropic avança rumo à IA que melhora a si mesma

A Anthropic divulgou dados internos que indicam um progresso significativo na direção da automelhoria recursiva de inteligência artificial — cenário em que um sistema de IA seria capaz de projetar e desenvolver seu próprio sucessor de forma totalmente autônoma. Embora ainda não tenham chegado lá, os números mostram que a fronteira está se movendo rápido: engenheiros da empresa hoje entregam, em média, oito vezes mais código por trimestre do que no período de 2021 a 2025. O fenômeno não é fruto de mais contratações, mas da delegação crescente de tarefas de desenvolvimento para os próprios modelos de IA. Segundo a Anthropic, mais de 80% do código incorporado ao seu repositório em maio de 2026 foi escrito pelo Claude. A empresa também observa que a duração das tarefas que os modelos conseguem completar de forma confiável dobra a cada quatro meses — em março de 2024, o Claude Opus 3 resolvia tarefas de quatro minutos; um ano depois, o Sonnet 3.7 já lidava com tarefas de 90 minutos; e o Opus 4.6, em 2026, alcançou tarefas de doze horas. Se a tendência se mantiver, tarefas que levam dias para um humano podem entrar no alcance ainda este ano. Por que isso importa? A automelhoria recursiva é apontada como um divisor de águas na história da tecnologia, com potencial para acelerar descobertas em ciência, saúde e outras áreas. Mas o mesmo movimento traz riscos: se sistemas forem capazes de se aperfeiçoar sem supervisão humana direta, os mecanismos de segurança, monitoramento e alinhamento de comportamento se tornam muito mais críticos. A Anthropic ressalta que ainda há lacunas importantes — especialmente na capacidade de os modelos exercerem julgamento para escolher metas —, mas o ritmo de avanço preocupa especialistas em governança de IA. Os dados coletados internamente mostram que o Claude já é capaz de executar experimentos de pesquisa de forma quase autônoma, alcançando desempenho sobre-humano em tarefas bem definidas de otimização de código. Em um teste recente, o modelo conseguiu acelerar um trecho de código em 52 vezes, enquanto um pesquisador humano levaria de quatro a oito horas para chegar a um ganho de quatro vezes. A empresa também implementou revisões automatizadas de código feitas pelo Claude, que teriam captado um terço dos bugs que causaram incidentes passados antes de chegarem à produção. A implicação é clara: a própria ferramenta que está acelerando o desenvolvimento também está se tornando mais confiável para revisar o trabalho que ela mesma ajudou a criar.