2026-06-21 04:33:19
Tinygrad 報告 GLM 5.2 在雙 Blackwell 配置下達成 120 tokens/秒,成本為 150,000 美元
根據 BlockBeats,在 6 月 21 日,Tinygrad 報導指出,GLM 5.2 在搭載雙網路 Blackwell 架構的 tinybox 組態中,推論速度可達每秒 120 個 token。價值 150,000 美元的組態可選擇兩台標準 tinybox 或一台 tinybox Pro。Tinygrad 將此方案定位為雲端推論服務的私有部署替代方案,標語為「buy once, never pay cloud fees again(買一次,永遠不再付雲端費用)」。GLM 尚未正式確認這些效能主張。