DeepSeek V4 finalmente foi lançado!


Fiz uma comparação
Atualmente é o modelo de código aberto mais poderoso.
Alcança a primeira linha mundial nos quatro grandes campos de código, matemática, textos longos e agentes, superando alguns indicadores o GPT-4o, Claude Opus 4.6.

I. Versão e posicionamento

- V4-Pro: topo de gama, comparável ao GPT-4o/Opus 4.6, o mais forte de código aberto.
- V4-Flash: leve e rápido, com alta relação custo-benefício.
- Arquitetura: MoE de 1,6T de parâmetros, aproximadamente 370B ativados por vez; contexto de 1 milhão de tokens.
- Poder de computação: Huawei Ascend 950PR de pilha completa, deixando de lado a Nvidia.

II. Comparação de desempenho central (avaliação oficial)

1️⃣ Programação (maior força)

- HumanEval: 90% (>Opus 4.5 88%, >GPT-4 82%).
- SWE-Bench: >80%, capacidade real de engenharia de software líder.
- Conclusão: o programador de IA mais forte do mundo.

2️⃣ Matemática/ Raciocínio

- MATH/STEM: supera todos os modelos de código aberto, comparable ao GPT-4o/Opus 4.6.
- Capacidade de agente: Agentic Coding é o melhor de código aberto, superior ao Claude Sonnet 4.5, próximo ao Opus 4.6 (não em modo de pensamento).

3️⃣ Textos longos

- Contexto: 1M de tokens (≈700 mil caracteres chineses), entre os três primeiros do mundo (apenas atrás do Gemini 3.1).
- Teste real: análise de romances de um milhão de palavras/todo o banco de dados sem travar, o melhor modelo doméstico para textos longos.

4️⃣ Conhecimento mundial

- Lidera todos os modelos de código aberto, ligeiramente abaixo do Gemini 3.1 Pro.

III. Classificação geral (24/04/2026)

- Primeira linha de código fechado:
1. Gemini 3.1 Pro (melhor em raciocínio/texto longo)
2. Claude Opus 4.6 (versátil e equilibrado)
3. GPT-4o (ecossistema mais forte)
4. DeepSeek V4-Pro (top em código e textos longos, primeiro nacional)
- Primeira linha de código aberto:
- DeepSeek V4-Pro (absoluto líder, avançando sobre Llama 3/Qwen 3)

IV. Vantagens principais

- ✅ Código mais forte: supera GPT-4o/Claude, capacidade para tarefas de engenharia.
- ✅ Contexto de 1M: processamento de textos longos de nível mundial.
- ✅ Poder de computação doméstico: Ascend completo, custo apenas 1/70 do GPT-4.
- ✅ Código aberto para uso comercial: V4-Pro/Flash com licença MIT.

V. Fraquezas

- Capacidade geral um pouco inferior ao Gemini 3.1/Opus 4.6 (especialmente raciocínio profundo).
- Capacidade multimodal (imagem e texto) inferior ao GPT-4o/Gemini.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar