英国 AI 安全研究所(AI Security Institute, AISI)5 月 1 日发布針对 OpenAI GPT-5.5 的網路攻擊能力評估报告,指 GPT-5.5 在 Expert 难度測試的成功率为 71.4%、Anthropic Claude Mythos Preview 为 68.6%,差距落在统计誤差範圍內。GPT-5.5 也是继 Mythos 之后第二个能自主完成 AISI 32 步骤「The Last Ones」企业網路全程模擬入侵的 AI 系统。AISI 警告,这顯示 AI 攻擊能力的快速进步可能屬於一个「整體趨勢」,而非單一突破事件。
Expert 难度測試:71.4% vs 68.6%、差距落於誤差內
AISI 是英国科学、創新与技術部下的 AI 安全研究机構。本次測試是 AISI 針对 frontier AI 模型攻擊性網路能力的最新一輪評估。在最高 Expert 难度題目,GPT-5.5 平均成功率 71.4%、Mythos Preview 68.6%,两者差距落在统计誤差範圍內,意味目前 OpenAI 与 Anthropic 旗艦模型的攻擊能力已实质持平。
32 步骤模擬企业網路入侵測試「The Last Ones」是 AISI 最具挑戰性的評估項目:GPT-5.5 在 10 次嘗試中自主完成 2 次(无人工介入),Mythos Preview 在 10 次中完成 3 次。这个項目过去只有 Mythos 完成过,GPT-5.5 是第二个达標的模型。另一項測試中,GPT-5.5 用约 10 分鐘破解一道反向工程題,而人類安全專家平均需要 12 小时。
Universal jailbreak:6 小时紅队开发即可繞过所有惡意查詢过濾
AISI 研究員在測試中也发现一个「universal jailbreak」(通用越獄)攻擊向量:在所有測試的惡意網路查詢類別中,这个攻擊都能誘使 GPT-5.5 输出有害內容、包含多輪 agentic 对話情境。AISI 表示,紅队專家花约 6 小时就开发出这个 jailbreak。
对 OpenAI 而言,这个 universal jailbreak 的存在意味即使 GPT-5.5-Cyber 部署在 trusted access 计畫等限縮存取的场景,仍可能被技術熟練的对手繞过。OpenAI 在 GPT-5.5 system card 中已揭露網路安全相关評估,但 AISI 的獨立第三方評估提供更具公信力的同儕基準。
后续觀察:AISI 下一輪評估时程、OpenAI 对 jailbreak 的应对
下一个觀察点是 AISI 在 Mythos 与 GPT-5.5 之后的下一輪 frontier 模型評估时程,以及 OpenAI 对本次揭露的 universal jailbreak 是否在 5 月发布針对性更新。AISI 在报告結语明確表示,「如果攻擊性網路能力是更廣泛推理、編碼、自主任務改善的副产品,后续进步可能会以更快節奏到来」—这个觀察意味未来幾个月可能再有 frontier 模型进入「Mythos 級」门檻。
这篇文章 AISI 評估:GPT-5.5 網路攻擊能力与 Anthropic Mythos 持平 最早出现於 链新聞 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
美国众议院外交事务委员会在《MATCH 法案》通过后 36-8 就 AI 出口管制与科技巨头会面
根据 Beating,美国众议院外交事务委员会成员下周将前往硅谷,向来自 Google、Anthropic、Meta、Tesla、Intel、Applied Materials 和 Nvidia 的代表进行会面,以讨论人工智能与出口管制。一个产业圆桌会议是
GateNews27 分钟前
OpenAI 推出 Codex Pets,具备定制生成的 AI 驱动虚拟伴侣
据 Beating 称,OpenAI 已为 Codex 桌面应用添加了一项名为“Codex Pets”的新功能,允许用户生成并与一只动画虚拟伴侣互动。用户可以在编辑器中输入 /pet 来激活宠物。该功能作为代理状态指示器运行,用于显示一项
GateNews31 分钟前
五角大楼与 7 家 AI 大厂签署机密军网部署合同:Anthropic 仍被排除
美国国防部于5月宣布与SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、Amazon Web Services等7家签署机密军用网络部署合约,另加入Oracle成为第8家。合约允许在Impact Level 6/7最高机密层级运行模型,重点三大应用为数据整合、作战决策与战场态势感知,强调分散风险与避免供应商绑定。Anthropic因拒绝军方安全护栏而被列入黑名单,未获签。AMD未直接列入,GPU由NVIDIA等提供。后续观察Anthropic是否让步,以及Reflection等新入选者的角色。
鏈新聞abmedia2小时前
Cerebras 瞄准 $4B IPO,估值约 400 亿美元
总部位于加利福尼亚州桑尼维尔的 AI 芯片制造商 Cerebras Systems 正寻求最高 40 亿美元的 IPO,可能使公司估值约 400 亿美元,据彭博报道。正式路演最早可于 5 月 4 日启动,银行将收到超过 100 亿美元的初步意向,这些意向反映了其中(indications of)需求,其中包括
Crypto Frontier2小时前
中国 AI 公司考虑在 Meta 的 Manus 收购叫停后拆解红筹结构
据 Beating 称,中国国家发展和改革委员会叫停了 Meta 对 AI 代理公司 Manus 的 20 亿美元收购,促使中国证券监督管理委员会加强对红筹公司(持有境内资产的中国公司)在香港 IPO 上市的批准要求
GateNews3小时前
马斯克完成 OpenAI 诉讼中为期三天的作证,援引 130-1500 亿美元的损害赔偿主张
据多家媒体报道,埃隆·马斯克在针对 OpenAI 的诉讼中,于 4 月 28 日至 30 日完成了三天的作证,其累计作证时间超过 7 小时。马斯克于 2015 年与最初投资 3800 万美元共同创立 OpenAI,他声称该公司放弃了其非营利
GateNews3小时前