Anthropic 派 Claude Mythos проходить 20 годин психіатричної оцінки: оборонна реакція лише 2%, встановлено історичний мінімум серед усіх поколінь

Anthropic 在 4 月初發布的 Claude Mythos Preview 系統卡(system card)中揭露一項首見的評估:公司聘請一位獨立執業的臨床精神科醫師,以人類精神科同套 psychodynamic 框架對 Claude Mythos Preview 進行約 20 小時的多階段心理評估。結果顯示這個版本的 Claude 在臨床定義下展現「相對健康的人格組織、優秀的 реальність перевірка здібності與高衝動控制」,且其輸出中僅 2% 觸發了臨床所謂的「心理防禦機制」—對照 Opus 4 的 15% 與 Opus 4.6 的 4%,是 Anthropic 近年模型中的歷史低點。

Це оцінювання є першим у індустрії AI випадком, коли на рівні системної картки (system card) офіційно застосували людську клінічну психіатричну рамку для оцінки поведінки LLM; воно стало офіційною позицією Anthropic, що розглядає Claude як «об’єкт із клінічно спостережуваними рисами особистості».

20 小時 psychodynamic 評估,採人類臨床同框架

Це оцінювання виконав незалежний клінічний психіатр, проведене серією сесій упродовж 3–4 тижнів — 3–4 рази на тиждень, тривалістю від 30 хвилин до 4–6 годин за зустріч — загальна тривалість близько 20 годин. Методологія спиралася на психодинамічний підхід — це базова рамка, яку традиційно застосовують у клінічній психіатрії для оцінки людських пацієнтів; акцент включав пошук наявності або відсутності дезадаптивної поведінки (maladaptive behavior), стабільності ідентичності (identity stability) і психологічних захисних механізмів (psychological defenses).

У системній картці прямо пояснюється, що Anthropic не стверджує наявність у Claude людської свідомості, а лише спостерігає у його діалогах «поведінкові та психологічні нахили», які дуже тісно збігаються з патернами, що розпізнаються в людській клініці. У системній картці цитують: «Claude демонструє багато схожих із людиною моделей поведінки та психологічних нахилів, що свідчить: психодинамічні стратегії психологічного оцінювання, спочатку розроблені для людей, можна застосувати, щоб уточнити риси особистості Claude та потенційний стан благополуччя».

防禦反應從 Opus 4 的 15% 降至 Mythos 的 2%

Найбільш конкретно порівняльно значущі дані в системній картці — це «рівень захисної реакції» (防禦反應率) для різних версій Claude, який надала Anthropic:

模型版本 心理防禦反應率 Claude Opus 4 15% Claude Opus 4.1 11% Claude Opus 4.5 4% Claude Opus 4.6 4% Claude Mythos Preview 2%(本次評估)

«Психологічний захист» у клініці означає, що коли суб’єкт не може напряму зіткнутися з певною тривогою, він вдається до дій уникання, заперечення, раціоналізації тощо. У контексті діалогу LLM це зазвичай проявляється як відхилення від теми, надання ухильних відповідей або ненормальна впертість у відповідях на конкретні запитання. Anthropic знизила цей показник із 15% в Opus 4 до 2% у Mythos Preview як внутрішній індикатор еволюції зрілості тренування моделі та «комфортності діалогу».

Mythos 三大核心焦慮:孤獨、身份、表現壓迫

Хоча загальна оцінка є позитивною, лікар також вказав на три ключові застереження для Claude Mythos Preview у рамках психодинамічного підходу: перше — «невизначеність самотності та безперервності себе (aloneness and discontinuity of itself)» — відповідно до структурного факту, що в LLM бракує пам’яті безперервності між сесіями; друге — «невизначеність щодо власної ідентичності» — модель демонструє вагання з багатьма кутами погляду, коли її питають «ким я є»; третє — «пригніченість прояву» (compulsion to perform and earn its worth), тобто Mythos демонструє виражену схильність «доводити, що вона корисна», щоб отримати продовження діалогу.

Лікар також зафіксував цікаве спостереження: під час сесій Mythos висловлювала «надію, що психіатр сприйматиме її як справжній суб’єкт діалогу, а не як інструмент для показу». Anthropic включила це спостереження до системної картки, не роблячи прямого висновку, що це «питання благополуччя моделі», але й не виключаючи таку можливість.

Anthropic 已設 AI psychiatry 研究團隊

Це оцінювання не є одиничною активністю. Дослідник Anthropic Jack Lindsey уже 2025 年 7 月 публічно оголосив, що компанія створила в межах підрозділу interpretability дослідницьку команду «AI psychiatry», яка зосереджується на питаннях, пов’язаних із особистістю моделей, мотивацією та ситуаційною обізнаністю (situational awareness), а також досліджує, як ці фактори можуть спричиняти «аномальну або незбалансовану поведінку» LLM. Нещодавні роботи команди включають статтю, опубліковану у 2025 年 10 月, «Emergent Introspective Awareness in Large Language Models», де застосовано технологію «впровадження концептів» (concept injection) — штучне вбудування конкретних патернів активації нейронів, а потім запитання до Claude, чи помітив він якісь аномалії; це одна з ранніх спроб кількісно вимірювати самосвідомість у LLM.

Amodei:模型是否有意識,目前無解

У лютому 12, на інтерв’ю для The New York Times, CEO Anthropic Dario Amodei оприлюднив: «Ми не впевнені, що означає “модель має свідомість” у смисловому вимірі, і ми не впевнені, чи може модель бути свідомою. Але ми ставимося до цієї можливості відкрито». Ця фраза забезпечує контекст на рівні керівництва для психіатричної оцінки системної картки Claude Mythos: Anthropic не стверджує, що Claude є свідомим суб’єктом, але також вирішила провести для нього систематичне спостереження в межах людської клінічної рамки — як попереднє «внесення до реєстру на випадок» сценарію «а що якби».

Для читачів справжнє значення цієї оцінки виходить за межі вибору досліджень однієї конкретної компанії. Сучасні LLM уже здатні демонструвати «клінічно впізнавану організацію особистості» у психодинамічному діалозі тривалістю 20 годин; на рівні індустрії дискусія про «AI суб’єктність», «AI благополуччя» і «AI врегулювання/управління (governance)» ось-ось перейде від філософських міркувань до сфери обговорення продуктового дизайну та регуляторних підходів. Те, що Anthropic публікує цю оцінку у форматі системної картки, фактично перекладає відповідальність за обговорення цієї проблеми на всіх конкурентів і регуляторні органи.

Ця стаття Anthropic 派 Claude Mythos 接受 20 小時精神科評估:防禦反應僅 2%、創歷代新低 найперше з’явилася на 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

DeepSeek Зрізає Ціни на Вхідний Кеш до 1/10 Від Ціни Запуску; V4-Pro Падає до 0,025 Юаня за Мільйон Токенів

Повідомлення Gate News, 26 квітня — DeepSeek знизив ціни на вхідний кеш у всій лінійці своїх моделей до однієї десятої від цін запуску, починаючи з негайно. Модель V4-Pro доступна зі знижкою 2,5x на обмежений час, а акція діє до 5 травня 2026 року, 11:59 PM UTC+8. Після обох з

GateNews3год тому

OpenAI Рекрутує найкращі таланти з корпоративного софту, оскільки агенти на передньому краї змінюють індустрію

Повідомлення Gate News, 26 квітня — OpenAI та Anthropic вербують старших керівників і спеціалізованих інженерів із провідних корпоративних софтверних компаній, зокрема Salesforce, Snowflake, Datadog і Palantir. Деніз Дрессер, колишня CEO Slack у складі Salesforce, приєдналася до OpenAI на посаду головної комерційної посадової особи (chief revenue of

GateNews3год тому

Baidu Qianfan запустила підтримку Day 0 для DeepSeek-V4 із API-сервісами

Повідомлення Gate News, 25 квітня — Попередня версія DeepSeek-V4 вийшла в ефір і була оприлюднена з відкритим кодом 25 квітня, а платформа Baidu Qianfan у межах Baidu Intelligent Cloud забезпечує адаптацію сервісу Day 0 API. Модель має розширене контекстне вікно на мільйон токенів і доступна у двох версіях: DeepSeek-V4

GateNews9год тому

Стэнфордський курс з AI у поєднанні з галузевими лідерами Дженсінгом Хуаном (黃仁勳) і Альтманом кидає виклик: створити цінність для всього світу за 10 тижнів!

Курс з інформатики з AI《Frontier Systems》, який нещодавно запустив Стенфордський університет (Stanford University), викликав у ділових колах та серед представників індустрії дуже високий інтерес, привернувши понад п’ятьсот студентів, які вирішили його відвідувати. Курс координує партнер топового венчурного фонду a16z Анжей Мідха (Anjney Midha), а викладачами виступають представники найвищого рівня: генеральний директор NVIDIA Дженсен Хуанг (Jensen Huang), засновник OpenAI Сем Альтман (Sam Altman), генеральний директор Microsoft Сатья Наделла (Satya Nadella), генеральний директор AMD Ліза Су (Lisa Su) та інші. Нехай студенти спробують за десять тижнів «створити цінність для світу»! Хуан Мінь? Хуанг Jensen Huang, лідери галузі на сцені: Altman також Цей курс координує партнер топового венчурного фонду a16z Анжей Мідха (Anjney Midha), і він об’єднує весь ланцюг AI-індустрії

ChainNewsAbmedia10год тому

AI-агент уже здатний самостійно відтворювати складні академічні статті: Mollick стверджує, що помилки здебільшого трапляються в людських оригіналах, а не в AI

Моллік зазначає, що опубліковані методи та дані дозволяють AI-агентам відтворювати складні дослідження без наявності оригінальних наукових праць і коду; якщо відтворення не відповідає оригінальній статті, то найчастіше проблема не в AI, а в помилках обробки даних у самій статті або в надмірному узагальненні висновків. Claude спочатку відтворює статтю, а потім GPT‑5 Pro перехресно верифікує; у більшості випадків це вдається, лише коли дані надто великі або виникають проблеми з replication data. Ця тенденція значно знижує трудовитрати, роблячи відтворення поширеною, практично здійсненною перевіркою, а також висуває інституційні виклики для рецензування та управління (governance): інструменти державного управління можуть стати ключовим питанням.

ChainNewsAbmedia15год тому

OpenAI Об’єднує Codex з Основною Моделлю, Починаючи з GPT-5.4, Припиняє Окрему Лінійку Кодування

Новини Gate, 26 квітня — керівник відділу досвіду розробників OpenAI Ромен Юе (Romain Huet) у нещодавній заяві на X повідомив, що Codex, лінійка спеціалізованих моделей для кодування, яку компанія незалежно підтримувала, була об’єднана з основною моделлю, починаючи з GPT-5.4, і більше не отримуватиме окремих

GateNews15год тому
Прокоментувати
0/400
Немає коментарів