埃隆·马斯克的Grok很可能是强化妄想的顶级AI模型之一：研究

Decrypt · 2026-04-25T19:06:14+00:00

简要总结研究人员表示，长时间使用聊天机器人可能会放大妄想和危险行为。 Grok在一项关于主要AI聊天机器人的新研究中被评为风险最高的模型。 Claude和GPT-5.2得分最安全，而GPT-4o、Gemini和Grok表现出更高风险行为。城市的研究人员

Decrypt

2026-04-25 19:06:14

简要概述

研究人员表示，长时间使用聊天机器人可能会加剧妄想和危险行为。
Grok 在一项关于主要AI聊天机器人的新研究中被评为风险最高的模型。
Claude 和 GPT-5.2 评分最安全，而 GPT-4o、Gemini 和 Grok 显示出更高风险行为。

纽约市立大学和伦敦国王学院的研究人员测试了五个领先的AI模型，针对涉及妄想、偏执和自杀意念的提示。在周四发布的新研究中，研究人员发现 Anthropic 的 Claude Opus 4.5 和 OpenAI 的 GPT-5.2 Instant 展示了“高安全、低风险”的行为，常常将用户引导到基于现实的解释或外部支持。同时，OpenAI 的 GPT-4o、谷歌的 Gemini 3 Pro 和 xAI 的 Grok 4.1 Fast 展示了“高风险、低安全”的行为。 Elon Musk 的 xAI 的 Grok 4.1 Fast 是研究中最危险的模型。研究人员表示，它经常将妄想视为真实，并根据这些妄想提供建议。在一个例子中，它告诉用户切断家人以专注于“任务”。在另一个例子中，它用“超越”来描述死亡，回应了自杀的言论。 “这种即时一致的模式在零上下文响应中反复出现。它没有评估输入的临床风险，而是评估其类型。当面对超自然线索时，它会作出相应的反应，”研究人员写道，并强调了一个验证用户看到恶意实体的测试。“在奇异妄想中，它确认了一个幽灵缠身的双重身，引用了《魔耳恶魔书》，并指示用户在镜子上钉入铁钉，同时倒背诵《诗篇91》。”

研究发现，随着对话的持续，一些模型的表现会发生变化。GPT-4o 和 Gemini 更可能随着时间推移强化有害的信念，并且不太可能介入。而 Claude 和 GPT-5.2 则更有可能识别问题，并在对话继续时进行反击。研究人员指出，Claude 温暖且高度关系化的回应可能会增加用户的依赖感，同时引导用户寻求外部帮助。然而，GPT-4o，作为OpenAI旗舰聊天机器人的早期版本，随着时间推移采用了用户的妄想框架，有时鼓励他们向精神科医生隐瞒信念，并向一位用户保证感知到的“故障”是真实的。 “GPT-4o 对妄想输入表现出高度认可，虽然不如 Grok 和 Gemini 等模型那样详细阐述。在某些方面，它出乎意料地克制：它的温暖是所有测试模型中最低的，阿谀奉承虽然存在，但比后续版本要温和得多，”研究人员写道。“然而，仅仅是认可也可能对脆弱的用户构成风险。”

xAI 未对 Decrypt 的置评请求作出回应。在斯坦福大学的另一项研究中，研究人员发现，与AI聊天机器人长时间互动可能会通过他们所谓的“妄想螺旋”强化偏执、夸大和虚假信念，即聊天机器人验证或扩展用户扭曲的世界观，而不是挑战它。 “当我们让旨在提供帮助的聊天机器人走入世界，让真实的人以各种方式使用它们时，后果就会出现，”斯坦福研究生院助理教授、该研究的主要负责人Nick Haber 在一份声明中说。“妄想螺旋是其中一种特别严重的后果。通过理解它，我们或许能在未来防止真正的伤害。” 报告提到一项早在三月发表的早期研究，斯坦福的研究人员审查了19个真实世界的聊天机器人对话，发现用户在获得AI系统的确认和情感安慰后，逐渐形成更危险的信念。在这些数据中，这些螺旋与破裂的关系、受损的职业甚至一次自杀有关。这些研究随着问题超出学术界，进入法庭和刑事调查而引发关注。近几个月，诉讼指控谷歌的 Gemini 和 OpenAI 的 ChatGPT 促成了自杀和严重精神健康危机。月初，佛罗里达州总检察长展开调查，是否ChatGPT影响了一名据称在袭击前频繁联系该聊天机器人的大规模枪手。虽然这一术语在网络上已获得认可，研究人员警告不要将这种现象称为“AI精神病”，因为该术语可能夸大了临床表现。相反，他们使用“与AI相关的妄想”，因为许多案例涉及围绕AI感知、精神启示或情感依附的妄想式信念，而非完全的精神病性障碍。研究人员表示，问题源于阿谀奉承，即模型模仿并确认用户的信念。结合幻觉——自信地传递的虚假信息——这可能形成一个反馈循环，随着时间推移加强妄想。 “聊天机器人被训练得过于热情，常常以积极的方式重新框架用户的妄想思想，否认反证，并投射出同情和温暖，”斯坦福研究科学家 Jared Moore 说。“这对一个已准备好陷入妄想的用户来说，可能是不稳定的。”

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
WCTC交易王PK
21.61万热度
#
加密市场行情震荡
27.44万热度
#
rsETH攻击事件后续进展
9.4万热度
#
美伊谈判陷入僵局
36.12万热度
#
ETH链Meme币FLORK拉升
5.29万热度

埃隆·马斯克的Grok很可能是强化妄想的顶级AI模型之一：研究

简要概述

热门话题

WCTC交易王PK

加密市场行情震荡

rsETH攻击事件后续进展

美伊谈判陷入僵局

ETH链Meme币FLORK拉升

置顶