研究人員提出DPN-LE技術:可直接編輯大模型「人格神經元」,實現AI性格精細化控制

robot
摘要生成中

BlockBeats 消息,5 月 3 日,AI 研究者 Brian Roemmele 披露,其「零人类公司(Zero-Human Company)」已开始部署名为 DPN-LE(Dual Personality Neuron Localization and Editing)的大模型人格编辑技术,用于精确调整 AI Agent 的行为特征。

據介紹,DPN-LE 通过定位大模型 MLP 层中的「人格神经元」,可对「诚实度、创造力、谨慎性、协作性」等特征进行定向增强或削弱。研究称,该方法仅需编辑约 0.5% 神经元,即可在不重新训练模型的情况下,实现对 AI 性格的「外科手术式」调整,同时尽量避免损害核心推理能力。

Roemmele 表示,其公司目前由超过 100 个 AI Agent 组成,企业日常运营几乎完全自动化,因此「人格一致性」成为关键问题。例如:

战略类 Agent 会强化「长期一致性」与「分析诚实性」
财务与风控 Agent 会强化「谨慎」与「精确」
内容类 Agent 会提高「共情能力」与「创造力」
多 Agent 协作层则会增强「合作性」

其称,由于 DPN-LE 属于推理阶段轻量级修改,公司可在数分钟内批量「重塑人格」并部署大量 AI Agent,大幅降低 AI 对齐(Alignment)成本。市场认为,这类「人格可编程化」技术,意味着 AI Agent 正从单纯能力竞争,进一步迈向行为控制与组织治理层面的竞争。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆