O laboratório chinês de IA DeepSeek lançou duas versões prévias de seu mais novo modelo de linguagem de grande escala, o DeepSeek V4, uma atualização muito aguardada do modelo V3.2 do ano passado e do modelo de raciocínio R1 que revolucionou o mundo da IA. A empresa afirma que tanto o DeepSeek V4 Flash quanto o V4 Pro são modelos de mistura de especialistas (MoE) com janelas de contexto de 1 milhão de tokens cada — o suficiente para permitir que grandes bases de código ou documentos sejam usados em prompts.

A abordagem de mistura de especialistas envolve ativar apenas um certo número de parâmetros por tarefa para reduzir os custos de inferência. O modelo Pro tem um total de 1,6 trilhão de parâmetros (49 bilhões ativos), o que o torna o maior modelo de pesos abertos disponível, superando o Kimi K 2.6 da Moonshot AI (1,1 trilhão), o M1 da MiniMax (456 bilhões) e mais que o dobro do DeepSeek V3.2 (671 bilhões). O menor, V4 Flash, possui 284 bilhões de parâmetros (13 bilhões ativos).

Desempenho e competividade

Publicidade
Publicidade

DeepSeek afirma que ambos os modelos são mais eficientes e performáticos que o DeepSeek V3.2 devido a melhorias arquitetônicas, e praticamente fecharam a lacuna com os principais modelos atuais, tanto abertos quanto fechados, em benchmarks de raciocínio. A empresa alega que seu novo modelo V4-Pro-Max supera seus pares de código aberto em benchmarks de raciocínio, e supera o GPT-5.2 da OpenAI e o Gemini 3.0 Pro em algumas tarefas. Em benchmarks de competição de codificação, a DeepSeek disse que o desempenho de ambos os modelos V4 é comparável ao GPT-5.4.

Limitações e custo

No entanto, os modelos parecem ficar ligeiramente atrás dos modelos de fronteira em testes de conhecimento, especificamente o GPT-5.4 da OpenAI e o mais recente Gemini 3.1 Pro do Google. Esse atraso sugere uma trajetória de desenvolvimento que fica atrás dos modelos de fronteira em aproximadamente 3 a 6 meses, escreveu o laboratório. Tanto o V4 Flash quanto o V4 Pro suportam apenas texto, ao contrário de muitos de seus pares de código fechado, que oferecem suporte para compreensão e geração de áudio, vídeo e imagens.

Notavelmente, o DeepSeek V4 é muito mais acessível do que qualquer modelo de fronteira disponível hoje. O modelo menor V4 Flash custa $0,14 por milhão de tokens de entrada e $0,28 por milhão de tokens de saída, enquanto o V4 Pro custa $0,42 por milhão de tokens de entrada e $1,10 por milhão de tokens de saída. Isso representa uma redução drástica de custo: o GPT-5.4, por exemplo, custa $15 por milhão de tokens de entrada.