GoogleのGemini 3 Deep Think大規模アップグレード:推論能力はOpus 4.6やGPT-5.2を圧倒し、「最も研究に優れたAI」になることを目指す

動區BlockTempo
BTC3.12%

Googleは「Gemini 3 Deep Think」の大規模アップデートを発表しました。ARC-AGI-2テストにおいて、84.6%の高得点を記録し、Claude Opus 4.6(68.8%)やGPT-5.2(52.9%)を大きく上回り、Codeforcesでは「伝説の師範」レベルに到達しました。 (前回の概要:ChatGPTの学習モード登場:家庭教師の黄昏、それとも黄金の教育時代の夜明けか?) (背景補足:Googleが正式に「Gemini 3」をリリース!世界最高知能AIモデルの登場、その注目ポイントは?)

この記事の目次

  • 試験だけじゃない、人間の誤りも捕捉
  • 市場シェアの地殻変動
  • 暗号産業への波紋
  • 科学の決勝戦は始まったばかり

Googleは本日(13日)、Gemini 3 Deep Thinkの大規模アップグレードを発表しました。ARC-AGI-2(AIの背後にある推論能力を測るテストで、知識量ではなく規則の抽出力を問うもの)において、Deep Thinkは84.6%を獲得しました。

参考までに、Claude Opus 4.6(Thinking Maxモード)は68.8%、GPT-5.2(Thinking xhighモード)は52.9%、人間の平均は約60%です。

さらに驚くべきことに、元のARC-AGI-1ではDeep Thinkは96%を記録し、「AI最難関試験の一つ」とされる基準テストの壁をほぼ打ち破っています。

現在、Deep ThinkはGoogle AI Ultraのサブスクライバー向けに提供されており、APIは企業向けに早期アクセスが可能です。

試験だけじゃない、人間の誤りも捕捉

スコア以外の点として、Googleは発表の中で重要な詳細を明かしています。Deep Thinkは、同行の専門家による査読を経た数学論文をレビューしている際に、これまで誰も気づかなかった論理的な抜け穴を見つけ出しました。この論文はロッターズ大学の数学者によって確認されています。

この事例の重要性は、モデルの標準化テストでのパフォーマンスではなく、実際のオープンな科学の場面で示された能力にあります。査読は学術界の最も重要な品質管理メカニズムであり、AIがこの過程で安定して価値ある補助を提供できるなら、その科学研究の加速効果はスコア以上のものとなるでしょう。

Deep Thinkはまた、2025年の国際物理オリンピックと化学オリンピックの筆記試験で金メダルレベルに達し、CodeforcesのElo評価は3455点となり、「伝説の師範」レベルに到達しています。これは、世界でごく少数の人間プログラマーだけが到達できるレベルです。

さらに、「人類最後の試験」(Humanity’s Last Exam)と呼ばれる、各分野の専門家が設計し、意図的にAIの解答困難さを狙った基準テストでは、Deep Thinkは48.4%(ツール未使用)を記録し、新記録を樹立しました。

市場シェアの地殻変動

AIの三大巨頭による技術競争は、市場の構図を変えつつあります。ChatGPTの市場占有率はピーク時の87%から約68%に低下し、Geminiは5%未満から18%以上に急上昇、AnthropicのClaudeも企業向け市場を着実に侵食しています。

Googleの競争優位は、その配信力にあります。GeminiはAndroidシステム、Chromeブラウザ、Google Workspace、検索エンジンに内蔵されており、モデルの能力が競合と並んだ場合でも、Googleはチャネルの優位性を活かしてユーザーを獲得できます。

しかし、配信の優位性は両刃の剣です。Geminiの体験が十分でなければ、他の競合よりも早くユーザーの信頼を失う可能性があります。ユーザーは「受動的に接触」しているためです。一方、OpenAIのユーザーは積極的に支払っているため、より高い忍耐力と粘着性を持ちます。

暗号産業への波紋

AIの軍拡競争のたびに、計算基盤の需要が高まっています。最先端モデルの訓練に必要なGPUクラスターのコストは、2024年の数億ドル規模から、2026年には数十億ドル規模へと膨れ上がっています。これにより、次の二つの動きが生まれています。

**第一、ビットコインマイナーの変革。**マイニングの収益性が圧縮される中(JPモルガンは今週、BTCの生産コストを7.7万ドルと推定し、価格は6.6万ドル付近)、大規模な計算インフラを持つマイナーはAI計算サービスへの転換を加速させています。

高コストのマイニング企業は「撤退」ではなく、「転業」です。ビットコインの採掘からAI計算リースへのシフトです。

**第二、AIトークンのストーリー。**GoogleやOpenAI、Anthropicが大規模アップグレードを発表するたびに、分散型計算の関連トークン(例:分散型計算プロトコル)は短期的に投機的な盛り上がりを見せることがあります。

しかし、これらのトークンの根本的な問題は変わりません。分散型計算は遅延とスループットの面で、企業レベルのAI訓練のニーズにはまだ遠く及びません。ストーリーは速く進むかもしれませんが、インフラは追いついていません。

科学の決勝戦は始まったばかり

Deep Thinkのアップグレードにより、Googleは再びAI競争の先頭に立ちました。少なくとも推論と科学の分野ではそうです。しかし、Googleの発表の言葉には微妙な変化も見られます。それは、「最も賢い汎用AI」ではなく、「科学のために生まれたAI」と繰り返し強調している点です。

汎用AIの基準テストがますます飽和し、差別化が難しくなる中、「私のAIは科学研究を支援できる」という価値提案は、「スコアが高いAI」よりも説得力があります。Deep Thinkが本当に査読を安定して支援し、薬物発見を加速し、物理シミュレーションで人間の見落としを見つけられるなら、それはスコアランキング以上に意義深いことです。

問題は、「基準テストで高得点を取る」から「実際の科学場面で信頼できる補助を行う」までの距離は、Googleが示唆するよりも遥かに遠い可能性があることです。基準テストには正解がある一方、科学には正解がないからです。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

五大基金が「制限」私人信貸の償還を行い、FOMC前に暗号通貨の流動性に影響

2月下旬以降、複数の民間信用ファンド管理会社が償還請求を制限し、流動性危機を引き起こしており、投資家はビットコインなどの流動性資産に資金を移す可能性がある。この時点でFOMC会議が間近に控えており、暗号資産市場の脆弱性をさらに悪化させる恐れがあり、ドイツ銀行の信用リスクの上昇も市場の不安を強めている。

MarketWhisper27分前

ロバート・キヨサキが2026年以降の最大の市場崩壊を警告、ビットコインが債務危機のヘッジとなる

ロバート・キヨサキは、2026年前後に史上最大の株式市場の崩壊が起こる可能性があると警告しており、これは2008年の金融危機後も依然として存在する構造的な問題と関係しています。彼が推奨するヘッジ資産には、金、銀、ビットコイン、イーサリアム、石油が含まれており、市場の動揺に対抗するためのものです。彼の予測の正確さはまちまちですが、それでも金融の安定性に対する広範な関心を引き起こしています。

MarketWhisper42分前

米国債のボラティリティが9ヶ月ぶりの高水準に上昇し、債券市場の「恐怖指数」が昨年6月以来の最高値を記録

3月13日、米国国債市場のボラティリティは9ヶ月ぶりの高水準に達し、ICE BofA MOVE指数が上昇しました。イラン戦争の激化により市場のインフレ懸念が高まり、原油価格の上昇が国債の魅力を減少させ、30年物国債の利回りが上昇しました。これにより、トレーダーは2026年の利下げ予想への賭けを縮小しています。投資家は、スタグフレーションによる不確実性を考慮する必要があります。

GateNews52分前

ビットコインがついに勝利したのか?JPモルガン:イラン戦争後の資金流入により、ビットコインETFの流入が金を超える

JPモルガンのレポートによると、イランの戦闘開始以来、ビットコイン現物ETFには1.5%の資金流入があり、一方、金ETFからは2.7%の資金流出が見られる。この現象は、市場の安全資産に対する嗜好が変化していることを示しており、機関投資家のビットコインへの関心が高まっていることを反映している。しかし、機関投資家は依然として金を好み、ビットコインには慎重な姿勢を維持している。アナリストはビットコインの長期的な展望に楽観的であり、その価格目標を26万6千ドルと予測している。

ChainNewsAbmedia1時間前

昨日、アメリカのイーサリアム現物ETFは純流入額7245万ドルとなり、Fidelity FETHが最も多く流入しました。

Gate Newsの報告によると、3月13日に暗号資産アナリストのTrader Tの監視のもと、昨日(3月12日)の米国イーサリアム現物ETFの純流入額は7245万ドルとなった。そのうち、Fidelity FETHの純流入は5202万ドルで、全体の71.8%を占めている。BlackRock ETHAの純流入は1877万ドル、Bitwise ETHWの純流入は89万ドル、Franklinの流入は...

GateNews2時間前

油価高騰を緩和!米財務長官:ロシア海上石油の購入を解禁、ビットコイン7.2万を突破

アメリカは原油価格の急騰緩和のため、海上に滞留しているロシア産石油の購入を臨時に解禁し、これにより原油価格が下落、ビットコインは7.2万ドルを突破した。同時に、金ETFから資金流出が見られ、ビットコイン市場の機関投資家の参加度が高まり、市場の流動性が改善していることを示している。

CryptoCity3時間前
コメント
0/400
コメントなし