英国 AI 安全研究所（AI Security Institute, AISI）5 月 1 日发布針对 OpenAI GPT-5.5 的網路攻擊能力評估报告，指 GPT-5.5 在 Expert 难度測試的成功率为 71.4%、Anthropic Claude Mythos Preview 为 68.6%，差距落在统计誤差範圍內。GPT-5.5 也是继 Mythos 之后第二个能自主完成 AISI 32 步骤「The Last Ones」企业網路全程模擬入侵的 AI 系统。AISI 警告，这顯示 AI 攻擊能力的快速进步可能屬於一个「整體趨勢」，而非單一突破事件。

Expert 难度測試：71.4% vs 68.6%、差距落於誤差內

AISI 是英国科学、創新与技術部下的 AI 安全研究机構。本次測試是 AISI 針对 frontier AI 模型攻擊性網路能力的最新一輪評估。在最高 Expert 难度題目，GPT-5.5 平均成功率 71.4%、Mythos Preview 68.6%，两者差距落在统计誤差範圍內，意味目前 OpenAI 与 Anthropic 旗艦模型的攻擊能力已实质持平。

32 步骤模擬企业網路入侵測試「The Last Ones」是 AISI 最具挑戰性的評估項目：GPT-5.5 在 10 次嘗試中自主完成 2 次（无人工介入），Mythos Preview 在 10 次中完成 3 次。这个項目过去只有 Mythos 完成过，GPT-5.5 是第二个达標的模型。另一項測試中，GPT-5.5 用约 10 分鐘破解一道反向工程題，而人類安全專家平均需要 12 小时。

Universal jailbreak：6 小时紅队开发即可繞过所有惡意查詢过濾

AISI 研究員在測試中也发现一个「universal jailbreak」（通用越獄）攻擊向量：在所有測試的惡意網路查詢類別中，这个攻擊都能誘使 GPT-5.5 输出有害內容、包含多輪 agentic 对話情境。AISI 表示，紅队專家花约 6 小时就开发出这个 jailbreak。

对 OpenAI 而言，这个 universal jailbreak 的存在意味即使 GPT-5.5-Cyber 部署在 trusted access 计畫等限縮存取的场景，仍可能被技術熟練的对手繞过。OpenAI 在 GPT-5.5 system card 中已揭露網路安全相关評估，但 AISI 的獨立第三方評估提供更具公信力的同儕基準。

后续觀察：AISI 下一輪評估时程、OpenAI 对 jailbreak 的应对

下一个觀察点是 AISI 在 Mythos 与 GPT-5.5 之后的下一輪 frontier 模型評估时程，以及 OpenAI 对本次揭露的 universal jailbreak 是否在 5 月发布針对性更新。AISI 在报告結语明確表示，「如果攻擊性網路能力是更廣泛推理、編碼、自主任務改善的副产品，后续进步可能会以更快節奏到来」—这个觀察意味未来幾个月可能再有 frontier 模型进入「Mythos 級」门檻。

这篇文章 AISI 評估：GPT-5.5 網路攻擊能力与 Anthropic Mythos 持平最早出现於链新聞 ABMedia。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

美国众议院外交事务委员会在《MATCH 法案》通过后 36-8 就 AI 出口管制与科技巨头会面

AI 行业动态

根据 Beating，美国众议院外交事务委员会成员下周将前往硅谷，向来自 Google、Anthropic、Meta、Tesla、Intel、Applied Materials 和 Nvidia 的代表进行会面，以讨论人工智能与出口管制。一个产业圆桌会议是

GateNews27 分钟前

OpenAI 推出 Codex Pets，具备定制生成的 AI 驱动虚拟伴侣

AI 行业动态 AI 工具应用

据 Beating 称，OpenAI 已为 Codex 桌面应用添加了一项名为“Codex Pets”的新功能，允许用户生成并与一只动画虚拟伴侣互动。用户可以在编辑器中输入 /pet 来激活宠物。该功能作为代理状态指示器运行，用于显示一项

GateNews31 分钟前

五角大楼与 7 家 AI 大厂签署机密军网部署合同：Anthropic 仍被排除

AI 行业动态

美国国防部于5月宣布与SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、Amazon Web Services等7家签署机密军用网络部署合约，另加入Oracle成为第8家。合约允许在Impact Level 6/7最高机密层级运行模型，重点三大应用为数据整合、作战决策与战场态势感知，强调分散风险与避免供应商绑定。Anthropic因拒绝军方安全护栏而被列入黑名单，未获签。AMD未直接列入，GPU由NVIDIA等提供。后续观察Anthropic是否让步，以及Reflection等新入选者的角色。

鏈新聞abmedia2小时前

Cerebras 瞄准 $4B IPO，估值约 400 亿美元

股票 AI 行业动态

总部位于加利福尼亚州桑尼维尔的 AI 芯片制造商 Cerebras Systems 正寻求最高 40 亿美元的 IPO，可能使公司估值约 400 亿美元，据彭博报道。正式路演最早可于 5 月 4 日启动，银行将收到超过 100 亿美元的初步意向，这些意向反映了其中（indications of）需求，其中包括

Crypto Frontier2小时前

中国 AI 公司考虑在 Meta 的 Manus 收购叫停后拆解红筹结构

AI 行业动态

据 Beating 称，中国国家发展和改革委员会叫停了 Meta 对 AI 代理公司 Manus 的 20 亿美元收购，促使中国证券监督管理委员会加强对红筹公司（持有境内资产的中国公司）在香港 IPO 上市的批准要求

GateNews3小时前

马斯克完成 OpenAI 诉讼中为期三天的作证，援引 130-1500 亿美元的损害赔偿主张

AI 行业动态

据多家媒体报道，埃隆·马斯克在针对 OpenAI 的诉讼中，于 4 月 28 日至 30 日完成了三天的作证，其累计作证时间超过 7 小时。马斯克于 2015 年与最初投资 3800 万美元共同创立 OpenAI，他声称该公司放弃了其非营利

GateNews3小时前

0/400

暂无评论