ブルームバーグが報じるところによれば、プライベートなフォーラムのグループが、Anthropic傘下のセキュリティAIモデル「Mythos」を当日に規制を突破したとみられる形で公開宣言したという。第三者の委託事業者のアクセス権限を通じて、当該モデルを用いたシステムへの侵入に成功したとされ、トップクラスのAIモデルにおける安全ガバナンスへの懸念が広がっている。
(Anthropicがグローバルの資安計画Glasswingを発表。新モデルMythosはなぜ一般公開されていないのか?)
Mythosの提供開始初日に無許可アクセスが発生
Anthropicは4月7日に新たなサイバーセキュリティAIモデルClaude Mythosを発表したが、これまで身元が明かされていないプライベートなオンラインフォーラム・グループが、報道によればこっそりとそのモデルへのアクセス権限を取得していた。
伝えられるところでは、彼らは従来のハッキング手法で侵入したのではなく、Anthropicが過去に使用していたモデルURLの形式を把握していたことを活かし、Mythosがシステム内のどこにあるのかを合理的に推測したという。決定的なほころびは、Anthropicの第三者委託事業者に雇われているある従業員にあった。彼はもともと、AnthropicのAIモデルを閲覧するための合法的な認可を持っており、フォーラムのメンバーはこの適法な入口を通じて、システムに侵入した。
その後、当該グループはブルームバーグに対して証拠としてスクリーンショットとリアルタイムの操作デモを提示し、さらにMythosを現在まで継続して使用していることも明かした。一方で、彼らの目的は「新しいモデルをいじること」にとどまり、破壊行為を行うつもりはない、と強調した。発見されたくないからだという。
Mythosとは何だ?なぜ外部から懸念が生じたのか?
Claude Mythosは、Anthropicが企業のネットワーク防御のために作ったAIモデルで、チームによって「能力が強すぎて公開リリースに不向きな」ツールと定義されている。その中核となる能力は、デジタルシステム内のセキュリティ脆弱性を能動的に特定し、企業が攻撃を受ける前に修復を完了できるよう支援することにある。
しかし、この「防御の剣」も「両刃の刃」になり得る。Anthropicは、いったんMythosが悪意ある人物の手に渡れば、その能力も攻撃に転用できるのだと認めている。そのため同社は「Project Glasswing」と呼ばれるセキュリティ計画を通じて、Mythosを厳格に審査した少数の大手機関やテクノロジー企業にのみ開放している。
この閉じた統制・管理メカニズムの中核となる前提は、信頼できる協力パートナーなら、互いのアクセス権限が漏洩しないよう担保できるということだ。
(AnthropicのMythosが規制当局を刺激する懸念、ベイゼント、パウエルは銀行の高官を招き緊急会議)
Anthropicの回答:調査中、影響なし
Anthropicはこれに対し、「第三者の供給業者の環境を通じて、未許可でClaude Mythos Previewにアクセスしたとする報告について、現在調査しています」と述べた。同社は、現時点では自社システムが影響を受けたことは確認されていないこと、そして今回の事案は最初の判断として「外部のハッカーによる攻撃というより、アクセス権限が悪用された可能性のほうが高い」としている。
現時点でMythosを先行利用していたユーザーに悪意ある行為は見られなくても、事案そのものがセキュリティ専門家の警戒レベルを高めている。セキュリティ企業Smarttech247のCEO、Raluca Saceanuは次のように指摘した:
強力なAIツールが、既定の統制メカニズムの外でアクセスされたり使用されたりした場合、リスクは単なるセキュリティインシデントにとどまらず、詐欺、ネットワーク濫用、またはその他の悪意ある用途に関する懸念につながる可能性が高い。
では、これはどんな影響をもたらすのか?AI安全の統制における弱点
今回の事件で本当に懸念されるのは、誰かが破壊を試みたことではなく、この出来事が明らかにしたシステム上の脆弱性にある。つまり、AI企業が高い機密性を持つモデルへのアクセス権限を第三者の供給業者へ委ねた場合、統制のネットワーク全体のどこか一箇所でもほころびがあれば、それが突破口となって危機を引き起こし得るということだ。
いまMythosの件は、産業全体に対し、AI能力が急速に進歩している状況では、安全アーキテクチャの設計は信頼だけに頼るのではなく、信頼が失敗しても耐えられる制度的なレジリエンス(制度のしなやかさ)を備える必要があることを改めて思い起こさせている。Anthropicにとって、協力パートナーの統制メカニズムに関する外部の信頼をどのように再構築するかは、調査そのものよりも長期的な課題となるだろう。
この記事「武器級の資安モデルMythosが無許可アクセスに遭った:彼らはどうやって実現したのか?」は、最初に「鏈新聞ABMedia」に掲載された。
関連記事
Judge Dismisses Fraud Claims in Elon Musk's OpenAI Lawsuit; Case Advances to Trial with Two Remaining Allegations
GoogleはAnthropicに400億ドルを追加投資:まず100億ドルを前払いし、業績に応じて300億ドルを放出。5GWのTPU計算リソースも配分