Opus 4.6 da Anthropic eleva desempenho de IA em tarefas jurídicas para quase 30%

O novo modelo alcançou 29,8% em testes únicos, um salto significativo em relação aos 18,4% anteriores.

06/02/2026 • 1 min de leitura • 616

INTRODUÇÃO

Há poucas semanas, os benchmarks do Mercor mostravam desempenhos abaixo de 25% para agentes de IA em tarefas profissionais como análise jurídica e corporativa, sugerindo que advogados estavam seguros da substituição por máquinas. No entanto, o cenário mudou drasticamente com o lançamento do Opus 4.6 da Anthropic, que elevou as pontuações e reacendeu o debate sobre o avanço acelerado dos modelos de fundação.

DESENVOLVIMENTO

O Opus 4.6 alcançou 29,8% em testes de única tentativa, um aumento impressionante em relação aos 18,4% registrados anteriormente. Em testes com múltiplas tentativas, a média chegou a 45%, indicando uma capacidade aprimorada de resolução de problemas complexos. Brendan Foody, CEO da Mercor, descreveu o salto como "insano", destacando o ritmo vertiginoso de progresso. O modelo introduziu recursos agenticos inovadores, como "enxames de agentes", que podem ter contribuído para esse desempenho superior em tarefas que exigem múltiplos passos.

CONCLUSÃO

Embora 30% ainda esteja longe da perfeição e não represente uma ameaça imediata à profissão jurídica, o avanço do Opus 4.6 demonstra que o progresso em IA não está desacelerando. Advogados devem reconsiderar sua confiança na segurança do emprego, pois a evolução tecnológica continua a surpreender e a reduzir a distância entre as capacidades humanas e as artificiais.

Opus 4.6 da Anthropic eleva desempenho de IA em tarefas jurídicas para quase 30%

O novo modelo alcançou 29,8% em testes únicos, um salto significativo em relação aos 18,4% anteriores.

Marcio Edison

Comentários

Leia Também

Anthropic says it's about to have its first...

Jensen Huang says he's found a 'brand new' $200B...

IrisGo, a startup backed by Andrew Ng, looks to...

Mex FM Brasil