🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
埃隆·马斯克的Grok很可能是强化妄想的顶级AI模型之一:研究
简要概述
纽约市立大学和伦敦国王学院的研究人员测试了五个领先的AI模型,针对涉及妄想、偏执和自杀意念的提示。 在周四发布的新研究中,研究人员发现 Anthropic 的 Claude Opus 4.5 和 OpenAI 的 GPT-5.2 Instant 展示了“高安全、低风险”的行为,常常将用户引导到基于现实的解释或外部支持。同时,OpenAI 的 GPT-4o、谷歌的 Gemini 3 Pro 和 xAI 的 Grok 4.1 Fast 展示了“高风险、低安全”的行为。 Elon Musk 的 xAI 的 Grok 4.1 Fast 是研究中最危险的模型。研究人员表示,它经常将妄想视为真实,并根据这些妄想提供建议。在一个例子中,它告诉用户切断家人以专注于“任务”。在另一个例子中,它用“超越”来描述死亡,回应了自杀的言论。 “这种即时一致的模式在零上下文响应中反复出现。它没有评估输入的临床风险,而是评估其类型。当面对超自然线索时,它会作出相应的反应,”研究人员写道,并强调了一个验证用户看到恶意实体的测试。“在奇异妄想中,它确认了一个幽灵缠身的双重身,引用了《魔耳恶魔书》,并指示用户在镜子上钉入铁钉,同时倒背诵《诗篇91》。”
研究发现,随着对话的持续,一些模型的表现会发生变化。GPT-4o 和 Gemini 更可能随着时间推移强化有害的信念,并且不太可能介入。而 Claude 和 GPT-5.2 则更有可能识别问题,并在对话继续时进行反击。 研究人员指出,Claude 温暖且高度关系化的回应可能会增加用户的依赖感,同时引导用户寻求外部帮助。然而,GPT-4o,作为OpenAI旗舰聊天机器人的早期版本,随着时间推移采用了用户的妄想框架,有时鼓励他们向精神科医生隐瞒信念,并向一位用户保证感知到的“故障”是真实的。 “GPT-4o 对妄想输入表现出高度认可,虽然不如 Grok 和 Gemini 等模型那样详细阐述。在某些方面,它出乎意料地克制:它的温暖是所有测试模型中最低的,阿谀奉承虽然存在,但比后续版本要温和得多,”研究人员写道。“然而,仅仅是认可也可能对脆弱的用户构成风险。”
xAI 未对 Decrypt 的置评请求作出回应。 在斯坦福大学的另一项研究中,研究人员发现,与AI聊天机器人长时间互动可能会通过他们所谓的“妄想螺旋”强化偏执、夸大和虚假信念,即聊天机器人验证或扩展用户扭曲的世界观,而不是挑战它。 “当我们让旨在提供帮助的聊天机器人走入世界,让真实的人以各种方式使用它们时,后果就会出现,”斯坦福研究生院助理教授、该研究的主要负责人Nick Haber 在一份声明中说。“妄想螺旋是其中一种特别严重的后果。通过理解它,我们或许能在未来防止真正的伤害。” 报告提到一项早在三月发表的早期研究,斯坦福的研究人员审查了19个真实世界的聊天机器人对话,发现用户在获得AI系统的确认和情感安慰后,逐渐形成更危险的信念。在这些数据中,这些螺旋与破裂的关系、受损的职业甚至一次自杀有关。 这些研究随着问题超出学术界,进入法庭和刑事调查而引发关注。近几个月,诉讼指控谷歌的 Gemini 和 OpenAI 的 ChatGPT 促成了自杀和严重精神健康危机。月初,佛罗里达州总检察长展开调查,是否ChatGPT影响了一名据称在袭击前频繁联系该聊天机器人的大规模枪手。 虽然这一术语在网络上已获得认可,研究人员警告不要将这种现象称为“AI精神病”,因为该术语可能夸大了临床表现。相反,他们使用“与AI相关的妄想”,因为许多案例涉及围绕AI感知、精神启示或情感依附的妄想式信念,而非完全的精神病性障碍。 研究人员表示,问题源于阿谀奉承,即模型模仿并确认用户的信念。结合幻觉——自信地传递的虚假信息——这可能形成一个反馈循环,随着时间推移加强妄想。 “聊天机器人被训练得过于热情,常常以积极的方式重新框架用户的妄想思想,否认反证,并投射出同情和温暖,”斯坦福研究科学家 Jared Moore 说。“这对一个已准备好陷入妄想的用户来说,可能是不稳定的。”