當用戶發出問題，晶片需要把整個模型的權重從記憶體裡"搬"到計算單元裡，然後才能生成回答。這個"搬"的過程，才是推理延遲的真正來源。英偉達的GPU用的是外接高帶寬記憶體（HBM），搬運這一步不可避免地引入延遲——對於每秒要處理幾千萬次請求的ChatGPT來說，這個延遲在乘以規模之後，變成了真正的性能瓶頸。

OpenAI內部工程師注意到這個問題時，他們在為Codex（程式碼生成工具）做優化，發現無論怎麼調參，響應速度都受制於英偉達GPU的架構上限。

換句話說，英偉達在推理端的劣勢，不是努力程度的問題，是架構的問題。

Cerebras的WSE-3晶片走了完全不同的路線。這塊晶片大到需要用晶圓級封裝——面積46,255平方毫米，比人的手掌還大——把90萬個AI核心和44GB超高速SRAM記憶體集成在同一塊矽片上。記憶體直接貼在計算核心旁邊，"搬運"的距離從公分級縮短到微米級。結果：推理速度比英偉達H100快15到20倍。

需要補充的是：英偉達並沒有坐以待毙。其最新的Blackwell（B200）架構在推理性能上比H100提升了4倍，正在大規模部署。但Blackwell追的是一個移動的靶——Cerebras同期也在迭代，而整個晶片市場湧現出的競爭對手，已經不只是Cerebras一家。

英偉達的200億：歷史最大併購背後的一張承認書

2025年12月24日，英偉達宣布了它歷史上最大的一筆收購。

目標是Groq。

Groq是Cerebras的同類競爭對手，主打的也是為推理優化的SRAM架構晶片——它叫LPU（語言處理單元），當時在公開測評中是全球推理速度最快的晶片服務。英偉達花了200億美元，把Groq的核心技術和創始團隊全部買走，包括創始人Jonathan Ross和多位谷歌TPU團隊出身的頂級晶片工程師。

這是英偉達2019年70億美元收購Mellanox之後，規模最大的一次併購，整整翻了三倍。

在許多分析師看來，這筆錢背後傳遞的訊息，遠比金額更重要：英偉達認為自己在推理端有結構性缺口，而且這個缺口大到值得花200億去堵。

如果英偉達真的相信自己的GPU在推理端無敵，它根本不需要收購Groq。這筆錢本質上是一張價值200億美元的技術採購單——承認SRAM嵌入式架構在推理場景裡有真實的技術優勢，承認英偉達靠現有產品線無法自然覆蓋這個優勢，用最貴的價格買下一個它自己填不上的技術缺口。

當然，英偉達收購後的官方敘事是另一套——“與Groq深度整合，提供更完整的推理解決方案。” 技術語言的翻譯版本是：我們意識到自己的東西不夠用，所以買了別人的。

OpenAI的200億：買晶片只是表面，入股才是關鍵

現在回到OpenAI這邊。

2026年1月，OpenAI和Cerebras簽了一份100億美元的三年算力採購協議——當時媒體報導的重點是"OpenAI正在多元化晶片供應商"，語氣輕描淡寫。

但4月17日最新曝光的細節，讓這件事的性質發生了根本變化：

第一，採購金額從100億變成了200億，翻了一倍。

第二，OpenAI將獲得Cerebras的認股權證，隨著採購規模增加，持股比例最高可達Cerebras總股本的10%。

第三，OpenAI還將向Cerebras提供10億美元的資料中心建設資金——換句話說，OpenAI在幫Cerebras蓋廠。

這三個細節放在一起，畫出來的圖景完全不同：OpenAI不只是在買晶片，OpenAI是在孵化一個供應商。

這個邏輯在科技史上有清晰的先例。2006年蘋果開始與三星合作定制A系列晶片，最初也是大宗採購協議，但隨著蘋果不斷加深參與、最終自研M系列晶片，供應鏈的控制權徹底從英特爾和三星那裡轉移到蘋果自己手上。OpenAI在做的，有幾分類似——但有一個重要邊界：蘋果從一開始就掌握晶片設計權，OpenAI目前仍然是採購者，Cerebras上市後也將獨立發展、服務更多客戶。這條路的終點未必是OpenAI完全掌控Cerebras，更可能是雙方建立深度互依的生態共同體。

一方面用200億和入股綁定Cerebras，確保非英偉達的推理算力持續供應；另一方面，OpenAI正在與博通合作研發自有ASIC晶片，預計2026年底量產。兩條腿同時走，終點是算力自主。

Cerebras今天IPO，你買的是真正的什麼

4月17日，Cerebras正式提交納斯達克IPO申請，目標估值350億美元，計劃融資30億美元。

這個估值，距離它2025年9月還是81億美元，漲了四倍多。今年2月剛完成新一輪融資，當時估值已升至230億美元，IPO目標的350億在此基礎上又溢價了52%。

熟悉Cerebras歷史的人知道，這是它第二次嘗試上市。第一次，2024年，因為核心客戶G42（阿聯酋主權科技投資基金）佔當年收入的83%~97%，CFIUS以國家安全為由介入審查，IPO被迫撤回。

這次，G42已經從股東名單中消失，取而代之的是OpenAI。

換句話說，Cerebras的客戶集中度結構性問題尚未根本解決——大客戶的名字換了，依賴大客戶的格局還在。投資者要做的判斷是：這個大客戶是更好還是更糟？從信用角度看，OpenAI顯然優於G42；從戰略角度看，OpenAI同時也是Cerebras的競爭對手孵化者——它的自研ASIC一旦成熟，對Cerebras是真實的替代威脅。

公平起見，Cerebras也在積極拓展其他客戶，招股書預計將列出更多元化的收入來源，集中度會有所改善。但在OpenAI自研晶片量產之前，這個問題的答案還沒有揭曉。

買Cerebras的股票，你實際上是在同時押注：OpenAI會持續選擇Cerebras，且 OpenAI的自研ASIC不會提前到來。這兩條，都不是確定的。

當然，多頭理由也是真實的：如果推理市場的規模按預測軌道增長，Cerebras哪怕只在這個市場裡佔到一個小份額，絕對數字也相當可觀。問題不在於Cerebras有沒有機會，而在於350億的定價是否已經反映了最樂觀的情形。

兩個200億，對稱地出現在2025年底到2026年4月這段時間裡。

一個來自全球最大的AI晶片賣家，買下了推理市場競爭對手的技術。

一個來自全球最大的AI買家，孵化了推理市場上挑戰英偉達的公司。

英偉達的200億是防禦——它用最貴的價格堵住了一個自己填不上的技術缺口。

OpenAI的200億是進攻——它在燒錢建設一條不依賴英偉達的推理高速公路，同時拿到了這條路上一个收費站的認股權。

這場戰爭沒有槍聲，但資金的流向從來不說謊。兩筆錢告訴你的，比任何AI發布會都更清楚：AI推理基礎設施的控制權，正在被爭奪。而這塊市場，2026年將佔到全行業算力支出的三分之二。

Cerebras的IPO，是這場戰爭吹響的號角。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
GatePreIPOs首發SpaceX
20.45萬熱度
#
Gate13週年現場直擊
54.73萬熱度
#
山寨幣強勢反彈
733.3萬熱度
#
加密市場回升
10.38萬熱度
#
Kalshi與內華達州的監管權爭議
46.44萬熱度

兩個200億美元：OpenAI 和英偉達在打一場「推理之戰」

熱門話題

GatePreIPOs首發SpaceX

Gate13週年現場直擊

山寨幣強勢反彈

加密市場回升

Kalshi與內華達州的監管權爭議

置頂