2026-05-12 00:45:50
Thinking Machines 推出互動模型,回應時間 200 毫秒,表現優於 GPT-Realtime-2.0
根據 Beating、Thinking Machines(由前 OpenAI 執行長 Mira Murati 創立的實驗室),該實驗室釋出其 Interaction 模型的研究預覽版,特色是原生即時音訊與影像處理,並具備 200 毫秒的微回合回應。該模型可在同一時間進行傾聽、觀看與說話,同時支援即時使用者中斷。 TML-Interaction-Small 模型採用 2760 億(276-billion)參數的 MoE(混合專家)架構,每次推論啟用 120 億(12 billion)參數。官方數據顯示,其語音輪替延遲為 0.40 秒,且 FD-bench V1.5 分數為 77.8,兩者皆優於 GPT-Realtime-2.0 與 Gemini 3.1 Flash Live。預計在未來幾個月開放有限的預覽存取。