Она написала 14 страниц диссертации, уволена Google, через пять лет все пророчества о рисках ИИ оказались верными

2020 年,Timnit Gebru 因拒絕撤下一篇警告 AI 系統風險的論文而被 Google 開除。五年後,那篇 14 頁文章裡的五個核心預言,幻覺、偏見、碳排、資料汙染、語言中心化,全數命中。
(前情提要:AI 與 ChatGPT 機器人為何越來越差?Nature 研究:模型越大沒幫助)
(背景補充:史丹佛報告:AI 耗電達比特幣挖礦一半,中美模型差距僅剩 2.7%)

本文目錄

Toggle

  • 14 頁,五類系統性風險
  • 五個預言,五組現實對照
  • 最深的預言,從第一天就成真了

一篇 14 頁的學術論文,讓她失去了工作…。2020 年 12 月,Timnit Gebru 還在休假,卻收到一封 email,告知她已被 Google 解雇。當時她的身份是 Google 倫理 AI 團隊共同負責人。

她被開除的原因,是 Google 要求她撤掉或拿掉員工掛名的一篇論文。那篇論文在她離職後三個月,於 2021 年 3 月正式刊登於 ACM FAccT 研討會。標題是〈論隨機鸚鵡的危險:語言模型會不會太大?〉,六位共同作者中有四位是 Google 員工,另一位以化名「Shmargaret Shmitchell」掛名,本名 Margaret Mitchell,後來同樣遭到 Google 解雇。

五年後回頭看,這篇文章的每一個核心警告,都在現實中找到了對應的案例。

14 頁,五類系統性風險

〈隨機鸚鵡〉論文的核心主張,是大型語言模型(LLM)在結構上存在五類系統性風險:幻覺與無理解、偏見放大、環境成本、訓練資料無法稽核、以及語言中心化導致低資源語言劣化。但論文真正最深的一條論點,是這五條之所以難以被解決的根本原因。

論文明確指出:打造 LLM 的公司,其財務與競爭誘因在結構上不可能讓「安全與倫理」拖慢產品上線速度。簡單來說就是,只要市場競爭夠激烈、資本壓力夠大,任何公司都會在「快點上線」和「做得夠安全」之間傾向前者。

Gebru 被開除這件事本身,就是最直接的注腳。她提出的是一份帶引用的研究檔案;Google 的回應,是要求她拿掉員工掛名或撤稿。她拒絕,然後在休假中收到開除通知。

五個預言,五組現實對照

預言一:流暢但無理解

論文在 2021 年就描述了後來被稱為「幻覺」的現象:LLM 只是依照機率把語言形式縫在一起,「沒有任何對意義的指涉」。聽起來通順,不代表說的是真的,這就是今天每個 AI 用戶都遇過的問題。

預言二:偏見放大

論文警告,用歷史資料訓練的模型會系統性地複製既有偏見。Amazon 從 2014 年開發的 AI 招募工具,到 2018 年因系統性歧視女性應徵者被廢棄,模型從以男性為主的歷史履歷中學到「優秀工程師」的樣子,導致含「women’s」字樣的履歷自動扣分。

Obermeyer 等人 2019 年發表於《Science》的研究則揭露,一個廣泛使用的醫療風險演算法以「醫療花費」替代「病情嚴重程度」,導致相同風險分數下黑人病患實際病情更重;修正後,被標記需要額外照護的黑人病患比例將從 17.7% 提高到 46.5%。

預言三:環境成本

論文引用 Strubell 等人 2019 年的研究,警告訓練成本被低估。這個論點後來被流傳為「訓練一個模型等於 5 輛車終身排放」,但需要釐清:那是使用神經架構搜尋(NAS)這個極端情境下的數字,約 284 公噸 CO₂e,並非每個模型的普遍情況。

真實的後續發展更令人不安。Google 2024 年環境報告顯示,2023 年溫室氣體排放達約 1,430 萬公噸 CO₂e,較 2019 年基準增加 48%,主因是 AI 帶動的資料中心用電大幅攀升,直接威脅 Google 原訂的 2030 年碳中和目標。

預言四:訓練資料無法稽核

論文警告,網路規模資料集太大,有害內容會混入而不被發現。2023 年 12 月,史丹佛網路觀測站在 LAION-5B 資料集中找到 3,226 筆疑似兒少性虐待內容(CSAM),其中 1,008 筆經外部機構確認。LAION-5B 是包含 58.5 億組圖文對的公開爬取資料集,曾用來訓練 Stable Diffusion,事件曝光後隨即下架。規模越大,盲點越大。

預言五:語言中心化

論文指出英語為主的語料庫會造成語言能力落差。這個預言後來衍生出一個被扭曲的說法:「57% 的新英文網頁是 AI 生成」,這是錯的。Thompson 等人 2024 年的研究分析了 63.8 億個句子組成的網路語料庫,發現其中 57.1% 的句子屬於多語平行集合,也就是很可能是機器翻譯產生的低品質重複內容,且在低資源語言中比例尤高。

低資源語言的處境不只是被忽視,而是正在被劣質機器翻譯的產物汙染,這正是 Gebru 原始預言的核心。

最深的預言,從第一天就成真了

五個預言,每一個都在現實中找到了對應案例,時間從 2018 年到 2024 年不等。但論文最核心的主張,從來不是「AI 會出問題」這種模糊警告,而是「整個系統被設計成無法自我修正」。

誘因決定行為。當競爭壓力要求快速上線,當公開提出安全疑慮可能讓整個團隊工作被停下來,理性的選擇就會是沉默。Gebru 的案例在 AI 研究社群留下一個清晰訊號:公開提出安全質疑,可能毀掉職涯。這個寒蟬效應,本身就是論文警告的機制在運作。

重點不是她每個細節都猜中了。重點是,她描述的那個系統,競爭誘因壓過倫理審查、規模壓過可稽核性、速度壓過安全,五年來沒有根本性地改變。而這個最深的預言,從她收到那封開除 email 的那一刻起,就已經完成驗證了。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено