INTRODUÇÃO

Há poucas semanas, os benchmarks do Mercor mostravam desempenhos abaixo de 25% para agentes de IA em tarefas profissionais como análise jurídica e corporativa, sugerindo que advogados estavam seguros da substituição por máquinas. No entanto, o cenário mudou drasticamente com o lançamento do Opus 4.6 da Anthropic, que elevou as pontuações e reacendeu o debate sobre o avanço acelerado dos modelos de fundação.

DESENVOLVIMENTO

Publicidade
Publicidade

O Opus 4.6 alcançou 29,8% em testes de única tentativa, um aumento impressionante em relação aos 18,4% registrados anteriormente. Em testes com múltiplas tentativas, a média chegou a 45%, indicando uma capacidade aprimorada de resolução de problemas complexos. Brendan Foody, CEO da Mercor, descreveu o salto como "insano", destacando o ritmo vertiginoso de progresso. O modelo introduziu recursos agenticos inovadores, como "enxames de agentes", que podem ter contribuído para esse desempenho superior em tarefas que exigem múltiplos passos.

CONCLUSÃO

Embora 30% ainda esteja longe da perfeição e não represente uma ameaça imediata à profissão jurídica, o avanço do Opus 4.6 demonstra que o progresso em IA não está desacelerando. Advogados devem reconsiderar sua confiança na segurança do emprego, pois a evolução tecnológica continua a surpreender e a reduzir a distância entre as capacidades humanas e as artificiais.