Anthropic 執行長 Dario Amodei 於 6 月 10 日發表政策文章,呼籲對前沿 AI 模型進行強制性的第三方測試,並授權政府可阻止未通過安全稽核的系統。該文章題為《Policy on the AI Exponential》,在 Anthropic 釋出 Claude Fable 5 的隔天到來,並搭配一項關於模型測試的立法提案以及一套工作替代的框架。Amodei 表示,單靠透明度已不再能符合快速進步的 AI 技術所帶來的風險。Anthropic 先前在 2025 年支持以揭露為基礎的法規,包括加州的 SB 53、紐約的 RAISE Act,以及伊利諾州的 SB 315;但 Amodei 現在提出一套以美國聯邦航空總署(FAA)為模型的制度,要求高於運算門檻的模型在四個領域接受強制稽核:網路安全、生物武器、失控,以及自動化 AI 研究。 Amodei 提出強制性的第三方 AI 稽核 Amodei 的提案要求高於運算門檻的前沿 AI 模型在四個領域接受強制性的第三方稽核:網路安全、生物武器、失控,以及自動化 AI 研究。Amodei 在文章中寫道:「前沿 AI 模型,就
MIT Media Lab 的研究人員發現,使用 AI 來評估新聞準確性的使用者,可能會在獨立辨識錯誤資訊方面變得不那麼有效,依據一項追蹤 67 名參與者、歷時四週的新研究指出。儘管 AI 協助使錯誤資訊偵測準確度提升 21%,但參與者在沒有 AI 的新評估中的表現下降了 15.3 個百分點。這項研究發表之際,像 ChatGPT、Claude 和 Grok 這類 AI 聊天機器人正被愈來愈多地用來核實線上資訊,引發疑問:這些工具是否能幫助使用者培養批判思考能力,或是讓人對 AI 系統產生依賴。 MIT 研究人員追蹤 67 名使用 AI 偵測系統的參與者 研究人員打造了一套系統,結合 OpenAI 的 GPT-4o 與 Google Search,協助參與者評估新聞故事。參與者先各自判斷一則標題與一張圖片是真實或是偽造,接著在做出最終評估前,與 GPT-4o 討論該項內容。這項為期四週的研究產生了 7,203 則 AI 對話,以及 4,536 則新聞真實性判斷。 研究人員其後在沒有 AI 協助的情況下,讓參與者測試新的、先前未見內容,以判定其錯誤資訊偵測能力是提升還是下降。團隊使用 An