インサイダーによると、DeepSeek V4はClaudeやChatGPTをコード作成で上回り、数週間以内にリリースされる予定です

要約

  • DeepSeek V4は数週間以内にリリースされる可能性があり、エリートレベルのコーディング性能を目指している。
  • インサイダーは、長文コンテキストのコードタスクでClaudeやChatGPTを上回る可能性があると主張している。
  • 開発者たちはすでに潜在的な破壊的変化に先駆けて盛り上がっている。

DeepSeekは、V4モデルを2月中旬頃にリリースする計画であると報じられており、内部テストの結果から見て、シリコンバレーのAI大手企業は警戒すべきだと考えられる。 杭州を拠点とするAIスタートアップは、自然な形で旧正月の2月17日頃にリリースを目指している可能性があり、_The Information_によると、コーディングタスクに特化したモデルを開発しているという。プロジェクトに直接関わる人物は、V4はAnthropicのClaudeやOpenAIのGPTシリーズよりも、特に非常に長いコードプロンプトの処理において内部ベンチマークで優れていると主張している。 もちろん、モデルに関するベンチマークや情報は公開されていないため、これらの主張を直接検証することは不可能だ。DeepSeekも噂を確認していない。

それでも、開発者コミュニティは公式発表を待たずに動いている。Redditのr/DeepSeekやr/LocalLLaMAではすでに盛り上がりを見せており、ユーザーはAPIクレジットを備蓄し、Xの愛好者たちはV4がDeepSeekの地位を、シリコンバレーの数十億ドルルールに従わないスクラップのアンダードッグとして確立するとの予測を素早く共有している。

AnthropicはClaudeのサブスクリプションをOpenCodeなどのサードパーティアプリでブロックし、xAIやOpenAIへのアクセスも遮断したと報じられている。

ClaudeとClaude Codeは素晴らしいが、まだ10倍優れているわけではない。これにより、他の研究所もコーディングモデルやエージェントの開発をより迅速に進めることになるだろう。

DeepSeek V4のリリースが噂されている…

— Yuchen Jin (@Yuchenj_UW) 2026年1月9日

これはDeepSeekにとって初めての破壊的な動きではない。2025年1月に同社がR1推論モデルをリリースした際、世界市場で$1 兆の売りが引き起こされた。 その理由は?DeepSeekのR1は、OpenAIのo1モデルと数学と推論のベンチマークで一致し、開発コストはわずか$6 百万ドルと報告されており、競合他社の約68分の1のコストだった。後にV3モデルはMATH-500ベンチマークで90.2%を記録し、Claudeの78.3%を大きく上回り、「V3.2 Speciale」アップデートでさらに性能を向上させた。

画像:DeepSeek

V4のコーディング重視は戦略的な転換となるだろう。R1は純粋な推論—論理、数学、形式的証明—を重視していたのに対し、V4は推論と非推論タスクを組み合わせたハイブリッドモデルであり、高精度のコード生成が直接収益につながる企業向け開発者市場をターゲットにしている。 支配的な地位を獲得するには、V4は現在80.9%のSWE-bench Verified記録を持つClaude Opus 4.5を上回る必要がある。しかし、DeepSeekの過去のリリースを参考にすれば、中国のAI研究所が直面する制約があっても、これを達成することは不可能ではないかもしれない。 秘密のソース 噂が本当だと仮定すると、この小さな研究所はどうやってそんな偉業を成し遂げるのか? 同社の秘密兵器は、2024年1月1日の研究論文「Manifold-Constrained Hyper-Connections(mHC)」にある可能性が高い。創設者の梁文峰と共著されたこの新しいトレーニング手法は、大規模言語モデルのスケーリングにおける根本的な問題—モデルの容量を拡大しつつ、訓練中に不安定になったり爆発したりしないようにする方法—に対処している。 従来のAIアーキテクチャは、すべての情報を狭い一つの経路を通じて強制的に流す。一方、mHCはその経路を複数のストリームに拡張し、情報交換を可能にしながら訓練崩壊を防ぐ。

画像:DeepSeek

Counterpoint ResearchのAI主任アナリスト、Wei Sunは、_Business Insider_へのコメントで、mHCを「衝撃的なブレークスルー」と呼んだ。彼女は、この技術はDeepSeekが「計算ボトルネックを回避し、知能の飛躍を実現できる」ことを示していると述べている。米国の輸出制限により高度なチップへのアクセスが制限されている状況でもだ。 Omdiaのチーフアナリスト、李哲秀は、DeepSeekが方法論を公開する意欲は、「中国のAI産業に新たな自信をもたらしている」と指摘した。同社のオープンソースアプローチは、かつてOpenAIがそうだったように、クローズドモデルや数十億ドルの資金調達ラウンドに移行する前の、開発者たちにとって理想的な存在となっている。



すべての人が納得しているわけではない。Redditの一部開発者は、DeepSeekの推論モデルは単純なタスクに無駄な計算を使っていると不満を漏らし、一方で批評家たちは、そのベンチマークは実世界の複雑さを反映していないと指摘している。2025年4月にバイラルになったMediumの投稿「DeepSeekはダメだ—もう我慢できない」では、モデルが「定型文のナンセンスとバグ」を生み出し、「幻のライブラリ」を作り出すと非難された。 DeepSeekには負の側面もある。プライバシー問題がつきまとい、一部政府はDeepSeekのネイティブアプリを禁止している。中国との関係や、モデルにおける検閲の問題も、技術的議論に地政学的な緊張をもたらしている。 それでも、勢いは止まらない。DeepSeekはアジアで広く採用されており、V4がコーディングの約束を果たせば、西洋の企業導入も進む可能性が高い。

画像:Microsoft

また、タイミングも重要だ。_Reuters_によると、DeepSeekは当初、2025年5月にR2モデルをリリースする予定だったが、創設者の梁がその性能に不満を抱き、計画を延長した。現在、V4は2月をターゲットにしており、R2は8月に続く可能性もあるため、同社は緊急性または自信を持って動いていることを示唆している。おそらく、その両方だ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン