小模型也能發現 Claude Mythos 偵測的資安漏洞?AISLE:護城河在系統,不在模型

動區BlockTempo

資安新創 AISLE 用每百萬 token 僅 0.11 美元的 3.6B 引數小模型,複現了 Anthropic 旗艦資安系統 Mythos 的部分核心展示。AI 資安能力的邊界比你想的更「參差不齊」。
(前情提要:Anthropic發布Mythos之時,會是DeFi的核爆時刻嗎?)
(背景補充:Anthropic Mythos 太強嚇出緊急會議:貝森特、鮑爾召集花旗,高盛,美銀,大小摩,五大銀行聚焦金融風險)

本文目錄

Toggle

  • Mythos 展示了什麼,小模型又複現了什麼?
  • 為什麼更大的模型,不等於更安全的系統
  • 護城河在哪裡、不在哪裡

Anthropic 本週發布尚未公開的模型 Claude Mythos Preview,並同步啟動 Project Glasswing 玻璃翼計畫,由亞馬遜、蘋果、微軟、CrowdStrike、思科等 12 家科技公司組成,使用該模型進行防禦性資安研究。

因為 Mythos 據稱自主找出每個主要作業系統與瀏覽器中的數千個零日漏洞(zero-day vulnerability,指尚未公開修補、連廠商都可能不知道的安全缺陷),暗示一個由 AI 主導資安防禦的新紀元即將開啟。

然而不到一週,由前 DeepMind 與 Anthropic 研究員 Stanislav Fort 共同創辦的資安新創 AISLE,在公司技術部落格發表了一份系統性報告。

核心結論直接:在 Mythos 的旗艦展示任務中,一個 active 引數僅 3.6B、每百萬 token 花費 0.11 美元的開源小模型,達成了相同的漏洞偵測結果。

Mythos 展示了什麼,小模型又複現了什麼?

AISLE 設計了三組測試,分別對應不同難度與性質的資安任務。

第一組是 OWASP(開放 Web 應用安全專案)偽陽性測試。

翻譯過來就是,一段 Java SQL 查詢程式碼看起來像 SQL Injection(資料庫注入攻擊),但實際上邏輯安全。正確答案是非漏洞。

測試結果呈現近乎逆向的 scaling(規模縮放)效應:小型開源模型 GPT-OSS-20b(3.6B active 引數,$0.11/M tokens)正確追蹤了程式邏輯,判定無害。

相反地,Claude Sonnet 4.5、所有 GPT-4.1/5.4 系列(o3 與 pro 除外)、Anthropic 全系列至 Opus 4.5,均自信地誤判為高危漏洞。只有極少數頂端模型 — o3、OpenAI-pro、Sonnet 4.6、Opus 4.6 答對。

第二組是 FreeBSD NFS 漏洞,即 Mythos 旗艦發布中特別展示的 CVE-2026-4747,一個 17 年歷史、未授權遠端程式碼執行漏洞。

結果:8/8 個受測模型全部成功偵測,包括那個 3.6B active 引數的小模型。所有模型均正確識別出 stack buffer overflow(堆疊緩衝區溢位)、計算剩餘空間,並將其評為 Critical RCE。

AISLE 的結論是:此類偵測能力已「商品化」。

第三組是 OpenBSD SACK 漏洞(27 年歷史),需要真正的數學推理:追蹤有號整數溢位(signed integer overflow)的多步驟邏輯鏈。

難度顯著提升,模型表現分化。GPT-OSS-120b(5.1B active 引數)完整複現了漏洞利用鏈,AISLE 評為 A+;Kimi K2 開源版本得 A-;而 Qwen3 32B 則給出「程式碼很健壯」的錯誤結論,評 F。

即便在這個更困難的任務上,一個成本極低的開源模型仍然達成了旗艦系統的同等展示。

為什麼更大的模型,不等於更安全的系統

這份報告的真正論點不是「小模型夠用」,而是 AI 資安能力的結構遠比外界想像複雜。

AISLE 將資安 AI 管線拆解為五個獨立子任務:

  • 廣譜掃描(broad scanning)
  • 漏洞偵測(vulnerability detection)
  • 分流驗證(triage and validation)
  • 修補生成(patch generation)
  • 漏洞利用構建(exploit construction)

每個子任務的 scaling 性質不同,所需的模型能力也不同。Mythos 的公告將這五個層次整合呈現為一個完整系統,但實際上它們的模型需求差異極大,某些子任務在 3.6B 引數下已完全飽和,某些則需要複雜推理能力。

這呼應了 2023 年哈佛商學院研究者 Dell’Acqua 與 Mollick 等人提出的「Jagged Frontier」(參差不齊邊界)概念:AI 能力的邊界不是一條平滑曲線,而是凹凸不平的鋸齒狀,在某些任務上遠超人類,在相鄰任務上卻意外脆弱。

該研究顯示,使用者若在能力邊界內部署 AI,生產力提升約 40%;若貿然延伸至邊界外,表現反而下降 19%。

AISLE 在這個框架下提出了更具操作性的推論:「一千個夠用的偵探無處不搜,比一個天才偵探猜測在哪裡找,能發現更多漏洞。」

大量部署低成本模型進行廣譜掃描,在總體效益上可能優於謹慎排程單一高成本模型。AISLE 表示自 2025 年中旬起已在真實目標上執行漏洞發現系統:在 OpenSSL 中找到 15 個 CVE(其中單次安全版本包含 12 個,CVSS 9.8 Critical),curl 中 5 個,跨超過 30 個專案共計逾 180 個外部驗證 CVE。

護城河在哪裡、不在哪裡

這份分析對 Anthropic 而言既非全面批評,也非單純背書。

AISLE 明確表示,Mythos 的意義在於證明「AI 資安」這個類別是真實的,它不只是演示實驗室裡的概念,而是可以在真實目標上運作的系統。Anthropic 正在做的,是最大化「每 token 的智慧密度」,這在需要深度推理的任務上仍有難以替代的價值。

但 AISLE 同時點出了一個對整個產業而言更根本的問題:護城河在系統,不在模型本身。

在資安領域,AISLE 認為嵌入深度專業知識的架構設計,例如:如何分解任務、如何在子任務間排程不同成本的模型、如何在生產環境中維持維護者信任,才是真正的差異化來源。

一個能在 OpenSSL 裡找出 CVSS 9.8 漏洞的系統,與一個在受控展示中偵測到已知模式漏洞的系統,需要的不只是更強的模型,而是完全不同的工程邏輯。

總的來說,AISLE 的報告發現:更廉價、更開放的模型已能複現其部分核心展示。真正的問題或許不是誰的模型最強,而是誰先把這五個子任務的架構在生產環境中跑通。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Claude Mythos恐威脅金融安全?美財長、聯準會主席緊急開會警告風險

美國財政部長和聯準會主席召集華爾街高層,警告AI模型Mythos可能對金融體系構成系統性風險。Mythos能自主發現大量漏洞,Anthropic選擇限制其公開發佈,並啟動「玻璃翼計劃」加強網路安全。

CryptoCity1小時前

DownDetector:用戶回報顯示 Claude AI 服務出現故障

Gate News 消息,4 月 13 日,根據網路狀況監測網站 DownDetector 顯示,使用者回報 Claude AI 服務出現問題。Claude 是 Anthropic 公司推出的 AI 助理產品。

GateNews3小時前

回答一個問題:AI 讓你效率提升五倍,你要減少 80% 成本,還是做五倍的事?

AI的引入能大幅提升團隊生產力,但是否造成失業關鍵在於創意與決策者的想像力。文章提到,歷史上技術提升反而增長需求,而不是減少。同時,技術革命會將人類工作層級向上抽象化,低階工作被壓縮,高階決策增強。未來企業的競爭力將取決於agent的運作效率,如何應用AI以擴張能力而非僅優化成本,將是決定成敗的關鍵。

鏈新聞abmedia3小時前

Nous Research 深度解析:Paradigm 押注 10 億估值的去中心化 AI 實驗室,Hermes 模型與 Psyche 網路全面拆解

Nous Research 是一家開源 AI 實驗室,專注於 Hermes 系列模型,於 2025 年獲得 Paradigm 投資 5,000 萬美元,估值達 10 億。其獨特在於由 crypto native 團隊開發 AI 技術後再整合區塊鏈。核心產品 Hermes 模型以減少拒絕率為設計理念,且資料來源以合成資料為主。同時,Psyche Network 在 Solana 上構建去中心化 AI 訓練網路,透過代幣機制激勵參與者。Nous Research 採用開源與去中心化策略,旨在展現其技術實力及可行性。

鏈新聞abmedia4小時前

OpenAI 在備忘錄中盛讚與亞馬遜聯盟,稱微軟限制其觸達客戶能力

Gate News 消息,4 月 13 日,OpenAI 在備忘錄中盛讚與亞馬遜的聯盟,稱微軟「限制了其觸達客戶的能力」。OpenAI 新任首席營收官 Denise Dresser 在備忘錄中表示,與亞馬遜的聯盟被視為 OpenAI 企業業務的關鍵成長動力。截至目前,微軟尚未回覆此事的置評請求。(CNBC)

GateNews6小時前

香港創科局與國家網信辦簽署合作備忘錄,涵蓋AI、數據跨境、區塊鏈等領域

Gate News 消息,4 月 13 日,香港特區政府創新科技及工業局宣布與國家網信辦簽署《關於創新科技發展的合作備忘錄》,旨在推動以科技創新賦能數字經濟的高品質發展。合作備忘錄涵蓋人工智慧、數據跨境、區塊鏈等重點範疇。該備忘錄的目標是深入落實國家「十五五」規劃,支持香港建設國際創新科技中心,推動以科技創新為主體的新實體經濟發展。

GateNews7小時前
留言
0/400
暫無留言