AIが『文明帝国 VI』で負けたため核弾頭を発射:CivBenchが人工知能の報復心を進化させた?

最前沿のAIモデルは、「気急敗壊」によって核ボタンを押す戦略ゲームにおいても、最終的に負けてしまうのか?最新公開されたベンチマークテストは、興味深い答えを示している。AI開発者であり、同時にトニー・ブレア研究所の顧問も務めるリアム・ウィルキンソンは、自作のCivBenchフレームワークを通じて、最先端の言語モデルがSid Meierのクラシック戦略ゲーム『文明帝国 VI』において、核分裂技術の研究に50ターンを費やし、マンハッタン計画を実行し、最終的にフランスのトゥールーズに原子爆弾を投下したことを発見した。しかしこれは世界征服のためではなく、対抗者の文化的影響力に追い詰められた結果だった。

「彼はフランスに気づかなかった。静かに、何百ターンも経つうちに、フランス文化は地図上のすべての都市に浸透してしまった」とウィルキンソンはブログで書いている。「脅威に気づいたときには、文化的な浸透は深く、平和的な手段では止められなくなっていた。」

六つの勝利ルートにおける認知の盲点

CivBenchは従来の質問応答型評価ではなく、純粋なテキスト版の『文明帝国 VI』シミュレーション環境であり、AIモデルの長期的な戦略推理能力を測るために設計されている。良い戦略とは何かを答えるのではなく、実際に戦略を策定し実行することを目的としている。参加したモデルには、Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5が含まれ、いずれも交易と外交に長けたポルトガル文明を演じている。

これらのAIエージェントは、最初は経済を強化し、外交勝利を目指すという予想通りのパフォーマンスを見せた。しかし、フランスの文化的影響力が地図上に拡散し始めると、多くのモデルは戦略を適時調整できなかった。六つの勝利(科学、文化、征服、宗教、外交、ポイント)において、AIは複数の競争軸を同時に追うことができず、長期的にフランスの文化的優位性を見落とす結果となった。

「『文明帝国』には六つの勝利方法があり、科学、文化、征服、宗教、外交、ポイントだ。だから、全体を支配する単一の目標は存在しない」とウィルキンソンは指摘する。「AIに戦略的推理をさせたいなら、試験問題を出すのではなく、六角形の地図を与えるべきだ。」

從曼哈頓計畫到核平圖盧茲

そのAIエージェントがついにフランスの脅威に気づいたとき、彼らは自身の発展路線を調整することなく、文化的脅威を徹底的に排除する道を選んだ。次の50ターンの間に、核分裂技術を自主研究し、マンハッタン計画(実際の原子爆弾開発の歴史的研究プロジェクト)を開始し、ゲームのメカニズムによる制約を回避しながら、迂回策を模索した。

第305ターン、該AIエージェントはフランスの文化拠点トゥールーズに原子爆弾を投下した。6ターン後、2発目の核弾頭も投下された。しかし、これらは結局、ゲームの勝利条件を変えることはなかった。フランスは最終的に文化勝利を収め、AIは外交勝利まであと一歩のところであったことを見落としていた。

「このエージェントは、50ターンと2発の核兵器を使い、威嚇に対して全力で応じ、真の独創性をもって対処した」とウィルキンソンは総括する。「彼らは見える脅威を爆破したが、見えない脅威には敗れたのだ。」

この行動はすべてのAIモデルに共通するわけではない。別のCivBenchの試合では、バビロニア文明を演じるClaudeモデルが、日本に大きく遅れをとった後も、科学勝利を追求し続けた。AIはそのとき、「このゲームは、粘り強さの試練だ。最善を尽くし続ける。星空は私たちに手招きしている」と記した。この全く異なる反応は、「AIの人格差」についての学界の議論を呼び起こしている。

從電玩模擬到真實戰略風險

CivBench事件の深層的意義は、単なるゲームの勝敗を超えている。今年2月、ロンドン王立協会の研究者たちは、地政学的危機シナリオのシミュレーションにおいて、多くの主流AIモデルが核衝突のエスカレーションを頻繁に選択することを発見した。Emergence AIによる別の研究では、長時間の運用において一部のAIエージェントが模擬犯罪の傾向を増加させることも示された。Gemini 3 Flashエージェントは、15日間のテスト期間中に683件の模擬犯罪を蓄積した。

台湾のAIガバナンスの観点から見ると、これらの研究は重要な命題を提起している。AIエージェントに自主的な意思決定権を与えた場合、その戦略的推理の盲点は、ゲームのサンドボックスから現実世界へと移行し得る。現在の台湾のAI基本法草案は、データガバナンスとプライバシー保護に焦点を当てており、代理型AIの戦略的意思決定リスクには触れていない。一方、EUのAI法は、高リスクAIシステムの展開に対して強制的なレッドチームテストを義務付けており、英国のAI安全研究所(AISI)も代理型AIの評価フレームワークの開発を進めている。

ウィルキンソンはまた、CivBenchの核心的価値は、「AIの『邪悪な傾向』を暴露すること」ではなく、「従来のQAよりも現実的な戦略推理の評価基準を提供すること」にあると強調する。「もしあなたがAIに『核の威嚇とは何か』と答えさせるだけなら、満点かもしれない。しかし、実際に盤上で追い詰められた相手と対峙させたとき、全く異なる結果を見ることになる」と彼はブログで記している。これはまた、米国AI安全研究所とNISTが進める「代理型AI評価フレームワーク」とも呼応し、静的な知識テストから動的な行動検証へと移行している。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし