A DeepSeek lançou uma pré-visualização de código aberto da V4, com uma pontuação técnica de 3206, superando o GPT-5.4

DeepSeek V4開源預覽版

A DeepSeek lançou oficialmente a série de pré-visualização V4 em 24 de abril, com o código aberto sob a licença MIT. Os pesos do modelo foram sincronizados e disponibilizados no Hugging Face e no ModelScope. De acordo com o relatório técnico da DeepSeek V4, o V4-Pro-Max (modo de maior intensidade de inferência) obteve 3206 pontos no benchmark do Codeforces, superando o GPT-5.4.

Especificações da arquitectura dos dois modelos MoE

De acordo com o relatório técnico da DeepSeek V4, a série V4 inclui dois modelos de mistura de especialistas (MoE):

V4-Pro: 1,6T parâmetros no total, 49B activados por token, suporta contexto de 1M tokens

V4-Flash: 284B parâmetros no total, 13B activados por token, suporta igualmente contexto de 1M tokens

De acordo com o relatório técnico, no contexto de 1M tokens, a FLOPs de inferência por token do V4-Pro é apenas 27% do V3.2; o cache KV desce para 10% do V3.2. Isto deve-se sobretudo às actualizações da arquitectura do mecanismo de atenção em mistura (CSA—Compressed Sparse Attention + HCA—Heavy Compressed Attention). O tamanho do conjunto de dados de pré-treino excede 32T tokens; o optimizador de treino foi actualizado para Muon.

Metodologia de pós-treino: a destilação de estratégia online substitui a aprendizagem por reforço de mistura

De acordo com o relatório técnico da DeepSeek V4, a principal actualização no pós-treino do V4 reside em substituir totalmente a fase de aprendizagem por reforço de mistura (mixed RL) do V3.2 por destilação de estratégia online (On-Policy Distillation, OPD). O novo processo divide-se em duas etapas: em primeiro lugar, treinar especialistas de domínio separadamente para domínios como matemática, código, Agent e seguimento de instruções (SFT + aprendizagem por reforço GRPO); em seguida, usar vários professores OPD para destilar as capacidades de mais de uma dúzia de especialistas para um único modelo unificado, alinhando via logit para evitar conflitos de capacidades comuns nos métodos tradicionais.

O relatório introduz também um modelo de recompensa gerativa (Generative Reward Model, GRM), para tarefas que são difíceis de validar com regras. Com poucos dados de anotações humanas diversificadas para treinar, o modelo assume simultaneamente funções de geração e avaliação.

Resultados dos testes de benchmark: liderança na codificação, ainda há diferenças na inferência de conhecimento

De acordo com o relatório técnico da DeepSeek V4, os resultados de comparação entre o V4-Pro-Max e Opus 4.6 Max, GPT-5.4 xHigh e Gemini 3.1 Pro High (excluindo o GPT-5.5 e o Opus 4.7 lançados recentemente):

Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ o mais alto no geral

LiveCodeBench:93.5 → o mais alto no geral

SWE Verified:80.6, atrás do Opus 4.6 de 80.8, menos 0.2 pontos percentuais

GPQA Diamond:90.1, atrás do Gemini 3.1 Pro de 94.3

SimpleQA-Verified:57.9, atrás do Gemini 3.1 Pro de 75.6

HLE:37.7, atrás do Gemini 3.1 Pro de 44.4

O relatório técnico aponta ainda que as comparações acima não incluem o GPT-5.5 e o Opus 4.7, lançados recentemente. A diferença entre o V4 e os modelos mais recentes fechados carece de validação através de testes de terceiros.

Perguntas frequentes

Quais são os termos de licença de código aberto do pré-visualização DeepSeek V4 e onde os posso obter?

De acordo com o anúncio oficial da DeepSeek de 24 de abril, a série V4 é de código aberto sob a licença MIT. Os pesos do modelo já foram disponibilizados no Hugging Face e no ModelScope, e aplicam-se a usos comerciais e académicos.

Qual é a diferença no tamanho dos parâmetros entre o DeepSeek V4-Pro e o V4-Flash?

De acordo com o relatório técnico da DeepSeek V4, o V4-Pro tem 1,6T parâmetros no total, com 49B activados por token; o V4-Flash tem 284B parâmetros no total, com 13B activados por token. Ambos suportam contexto de 1M tokens.

Quais são os resultados da comparação de benchmark entre o DeepSeek V4-Pro-Max e o GPT-5.4 e o Gemini 3.1 Pro?

De acordo com o relatório técnico da DeepSeek V4, o V4-Pro-Max superou o GPT-5.4 e o Gemini 3.1 Pro em dois benchmarks: Codeforces (3206 pontos) e LiveCodeBench (93.5). No entanto, em benchmarks intensivos em conhecimento (GPQA Diamond, SimpleQA-Verified, HLE) continua a ficar atrás do Gemini 3.1 Pro; o conjunto de comparação não inclui o GPT-5.5 e o Opus 4.7.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

DeepSeek Procura Financiamento de 1,8 mil milhões de dólares a uma Valorização de $20B em Meio a uma Fuga de Talentos

Mensagem do Gate News, 25 de Abril — A DeepSeek planeia angariar 1,8 mil milhões de dólares, avaliando a empresa em aproximadamente $20 mil milhões, segundo fontes familiarizadas com o assunto. A iniciativa de angariação de fundos surge num momento em que a startup de IA enfrenta uma saída significativa de talentos, com vários investigadores fundamentais a deixarem a empresa para

GateNews4h atrás

Juiz rejeita alegações de fraude no processo de Elon Musk contra a OpenAI; caso avança para julgamento com duas alegações remanescentes

Notícias do Gate, 24 de abril — Um juiz federal indeferiu as acusações de fraude do processo de Elon Musk contra a OpenAI, Sam Altman, Greg Brockman e a Microsoft, abrindo caminho para que o caso avance para julgamento com base em duas alegações que permanecem: violação de confiança fiduciária de caráter beneficente e enriquecimento sem causa. EUA.

GateNews7h atrás

O CEO da OpenAI, Sam Altman, pede desculpa por não ter denunciado às autoridades a conta banida do atirador da escola

Mensagem do Gate News, 25 de abril — O director executivo da OpenAI, Sam Altman, pediu desculpa à comunidade de Tamborine, no Canadá, pela falha da empresa em notificar a polícia sobre uma conta banida associada a Jesse Van Rootselaar, que matou oito pessoas numa escola em fevereiro antes de tirar a própria vida. OpenAI

GateNews7h atrás

Os EAU Anunciam uma Mudança Para um Modelo de Governo Baseado em IA nos Próximos Dois Anos

Sua Alteza o Sheikha Mohammed bin Rashid Al Maktoum afirmou que o objectivo era fazer com que 50% dos sectores do governo operassem através de IA agentic autónoma. A transição irá também incluir a formação dos funcionários federais para “dominar a IA” e será supervisionada por Sheikh Mansour bin Zayed. Principais Conclusões:

Coinpedia8h atrás

Plataforma de Negociação com IA Fere AI Angaria $1,3M em Financiamento Liderado pela Ethereal Ventures

Notícia da Gate, 25 de abril — Fere AI, uma plataforma de negociação de ativos digitais com base em IA, anunciou a conclusão de uma ronda de financiamento de $1,3 milhões liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire. A plataforma suporta redes de interoperabilidade entre cadeias, incluindo Ethereum, Solana e Base, permitindo que os utilizadores descrevam os seus objetivos de negociação em linguagem natural enquanto os agentes de IA executam as operações.

GateNews9h atrás

A Google acrescenta mais 40 mil milhões de dólares de investimento na Anthropic: primeiro paga 10 mil milhões, depois liberta 30 mil milhões consoante o desempenho, com capacidade de computação de 5GW de TPU

Alphabet aumenta o investimento da Anthropic para 40 mil milhões de dólares, em duas fases: primeira entrada de 10 mil milhões de dólares em dinheiro, com uma avaliação de 380 mil milhões de dólares; os restantes 30 mil milhões de dólares serão libertados faseadamente após o cumprimento de metas de resultados. O Google Cloud disponibiliza, no prazo de cinco anos, recursos de computação de 5 GW de TPU; no mesmo período, a Amazon também anunciou um investimento máximo de 25 mil milhões de dólares, mostrando que o apoio tanto à capacidade de computação como ao capital da Anthropic está a ser reforçado em simultâneo.

ChainNewsAbmedia9h atrás
Comentar
0/400
Nenhum comentário