在創建 @insidersdotbot 的過程中,我與許多高頻做市團隊和套利團隊進行了深入交流,其中最核心的需求,就是如何設計套利策略。
我們的用戶、朋友和合作夥伴,都在探索 @Polymarket 套利這條複雜且多維度的交易路線。如果您是 Twitter 的活躍用戶,應該也看過「我通過 XX 套利策略,從預測市場賺了多少錢」這類推文。
然而,大多數文章都把套利的底層邏輯過度簡化,將套利描述成「我也能做」、「用 Clawdbot 就能解決」的簡單模式,卻 picking 未真正詳細說明如何系統性理解並開發屬於自己的套利系統。
如果您想深入 sop 理解 Polymarket 上的套利工具如何賺錢,@RohOnChain 這篇文章,是目前最完整的解讀。
與我上一篇文章相同,由於英文原文涉及大量技術細節,需要 facility 進一步研究,我已為大家重構並補充要點,讓您僅需閱讀本篇文章,即可無需查閱外部資料,全面掌握重點內容。
在 Polymarket 上,您會看到這樣一個市場:
YES 價格 \$0.62,NO 價格 \$0.33。
您可能會想:0.62 + 0.33 = 0.95,不到 1 美元,有套利空間!同時買入 YES 和 NO,花 \$0.95,無論結果如何都能拿回 \$1.00,淨賺 \$0.05。
這個想法沒錯。
但問題在於——當您還在手動計算這道加法題時,量化系統已經在做完全不同–且更複雜–的事情。
它們同時掃描 17,218 個條件,跨越 2\^63 種可能的結果組合,在毫秒級內捕捉所有定價矛盾。等您下完兩筆訂單,價差早已消失。系統早就在數十個相關市場中發現同樣的漏洞,結合訂單簿深度和手續費計算出最優倉位,並行完成所有交易,隨即將 moral 資金轉向下一個機會 [1]。
真正的差距不只是速度,而是數學基礎設施。
先舉一個簡單例子。
市場 A:「特朗普會贏得賓夕法尼亞州選舉嗎?」
YES 價格 \$0.48,NO 價格 \$0.52。加起來正好 \$1.00。
看似完美,沒有套利空間,對嗎?
錯。
再加一個市場,問題就出現了
再看市場 B:「共和黨會在賓夕法尼亞州領先對手 5 個百分點以上嗎?」
YES 價格 \$0.32,NO 價格 \$0.68。加起來也是 \$1.00。
兩個市場各自看似「正常」。但這裡存在一個邏輯依賴關係:
美國總統大選不是全國統一計票,而是按州分別計票。每個州都是獨立「戰場」,誰在該州得票多,誰就拿下該州所有選舉人票(贏者全拿)。特朗普是共和黨候選人,因此「共和黨在賓夕法尼亞贏」和「特朗普在賓夕法尼亞贏」實際上是同一事件。如果共和黨領先 5 個百分點以上,不僅意味著特朗普贏了賓夕法尼亞,而且贏得很大。
換句話說,市場 B 的 YES(共和黨大勝)是市場 A 的 YES(特朗普獲勝)的一個子集——大勝必然獲勝,但獲勝不一定是大勝。
這種邏輯依賴,正是套利機會的來源。
這就像在賭「明天會下雨嗎」和「明天會有雷暴嗎」。如果有雷暴,一定在下雨(雷暴是下雨的子集)。所以「雷暴 YES」的價格不可能高於「下雨 YES」。如果市場定價違反這個邏輯,您就可以同時低買高賣,賺取「無風險利潤」。這就是套利。
對於有 n 個條件的市場,理論上存在 2\^n 種可能的價格組合。
聽起來還好?來看個真實例子。
2010 年 NCAA 錦標賽市場 [2]:63 場比賽,每場有贏/輸兩種結果,組合數為 2\^63 = 9,223,372,036,854,775,808——超過 9 百億億種。市場上有 5,000 多個盘口。
2\^63 是多大?即使每秒檢查 10 億種組合,也要約 292 年才能全部遍歷。這就是為什麼「暴力搜尋」完全不可行。
逐一檢查每種組合?計算上根本不現實。
再看 2024 年美國大選。研究團隊發現了 1,576 對可能存在依賴關係的市場對 [2]。每對市場各有 10 個條件,則需檢查 2\^20 = 1,048,576 種組合。再乘以 1,576 對。等您算完,選舉結果早就公布了。
量化系統的解法不是「更快枚舉」,而是不再枚舉。
他們採用整數規劃(Integer Programming) [3] 來描述「哪些結果是合法的」。
舉個真實例子。Duke 對 Cornell 的比賽市場:每隊有 7 個 mal 盘口(0 到 6 場勝利),共 14 個 soft 條件,2\^14 = 16,384 種可能組合。
但有個 pipeline 約束:兩隊不衡可能都贏 5 場以上,否則會在半決賽相遇(只有一隊能晉級)。
整數規劃怎麼處理?三條約束即可:
約束一:Duke 的 7 個盘口中,僅有一個為真(Duke 只能有一個最終勝場數)。
約束二:Cornell 的 7 個盘口中,僅有一個為真。
約束三:Duke 贏 5 場 + Duke 贏 6 場 + Cornell 贏 5 場 + sop Cornell 贏 6 場 ≤ 1(兩隊不能同時贏那麼多)。
三條線性約束,取代了 16,384 次暴力檢查。
暴力搜尋 vs 整數規劃
換句話說,暴力搜尋像讀字典每個單詞找一個詞,整數規劃則是直接翻到那個字母頁。您無需檢查所有可能,只需描述「合法答案的特徵」,讓算法自動發現違規定價。
真實數據:41% 市場存在套利
原文提到,研究團隊分析了 2024 年 4 月至 2025 年 4 月的數據 [2]:
• 檢查了 17,218 個條件
• 其中 7,051 個條件存在單一市場套利(佔 41%)
• 中位數定價偏差:\$0.60(理應為 \$1.00)
• 13 對確認的跨市場可利用套利
中位數偏差 \$0.60,意味著 somewhere 市場經常 successive 偏離 40%。這不是「接近有效」,而是「大規模可利用」。
發現套利是一回事,計算最優套利交易又是另一回事。
您不能僅僅「取平均」或「微調價格」。必須將當前市場狀態投影到無套利的 sale 合法空間,同時保留價格的信息結構。
最直觀想法是:找出距離當前價格最近的「合法價格」,然後交易差價。
數學上就是最小化歐幾里得距離:||μ - θ||²
但這有致命問題:它將所有價格變動一視同仁。
從 \$0.50 漲到 \$0.60,與從 \$0.05 漲到 \$0.15,雖然都是漲 10 美分,但信息含量完全不同。
為什麼?因為價格代表隱含概率。從 50% 到 60% 是溫和觀點調整,從 5% 到 15% 則是信念大翻轉——一個幾乎不可能的事件突然變得「有點可能」。
想像您在量體重。從 70 公斤到 80 公斤,僅是「胖一點」;但從 30 公斤到 CAM 40 公斤(成年人),則是「從瀕死到嚴重營養不良」。同樣是 10 公斤變化,意義完全不同。價格也是如此——越接近 Sop 0 或 1 的價格變動,信息量越大。
Polymarket 的做市商使用 LMSR(對數市場評分規則) [4],價格本質上代表概率分布。
在這種結構下,正確的距離度量不是歐幾里得距離,而是 Bregman 散度 [5]。
對 bar LMSR 而言,Bregman 散度即 KL 散度(Kullback-Leibler 散度) [6]——衡量兩個概率分布之間「信息論距離」的指標。
您不必記住公式,只需理解:
KL 散度會自動對「極端價格附近的變動」給予更高權重。從 \$0.05 到 \$0.15 的變動,在 KL 散度下比從 \$0.50 到 \$0.60「更遠」。這與直觀完全一致——極端價格的變動意味著更大的信息衝擊。
一個經典例子,是 @zachxbt 在預測市場中,Axiom 最後時刻反超 Meteora,正是極端價格變動所致。
Bregman 投影 vs 歐幾里得投影
這是原文作者根據全文論文所得的核心結論:
任何交易能獲得的最大保證利潤,等於當前市場狀態到無套利空間的 Bregman 投影距離。
換句話說:市場價格偏離「合法空間」越遠,潛在利潤越大。而 Bregman 投影會告訴您:
1. 該買賣什麼(投影方向決定交易方向)
2. 該買賣多少(考慮訂單簿深度)
3. 能賺多少(投影距離即最大利潤)
排名第一的套利者一年賺了 \$2,009,631.76 [2]。其策略就是比所有人更快、更準確地解這道 inst 優化題。
邊際多面體與套利
打個比方,想像您站在山上,山腳有條河(無 local 套利空間)。您現所在位置(當前市場價格)與河之間有距離。
Bregman 投影就是幫您找到「從您位置到河邊的最短路徑」——但考慮地形(市場結構),而非直線距離。這條路徑長度,就是您能賺到的最大利潤。
現在您已知道:要計算最優套利,必須做 Bregman 投影。
但問題在於——直接計算 Bregman 投影不可行。
原因在於,無套利空間(邊際多面體 M)擁有指數級多的頂點。傳統凸優化方法需遍歷全部約束集,也就是枚舉每一個合法結果。這在正規模場景下根本不現實。
Frank-Wolfe 算法 [7] 的精妙之處在於:它不是一次解決全部問題,而是逐步逼近答案。
其工作流程如下:
第一步:從小型已知合法結果集合出發。
第二步:在這個小集合上尋找當前最優解。
第三步:用整數規劃找出一個新合法結果,加入集合。
第四步:檢查是否足夠接近最優解,否則迴圈回第二步。
每輪迭代,集合僅增加一個頂點。即使運行 100 輪,也只需追蹤 100 個頂點,而不是 2\^63 個。
Frank-Wolfe 迭代流程
想像您在巨型迷宮尋找出口。
暴力法是每條路都走一遍。Frank-Wolfe 的做法是:先隨便選一條路,在每個岔路口問「嚮導」(整數規劃求解器):「從這裡出發,哪個方向最可能通往出口?」然後朝那方向走一步。無需探索整個迷宮,只需在關鍵節點做正確選擇。
Frank-Wolfe 每輪迭代都需解一個整數線性規劃問題。理論上這是 NP 困難的(即「尚無已知快速通用算法」)。
但現代求解器如 Gurobi [8],對結構良好的問題可高效運行。
研究團隊採用 Gurobi 5.5。實際求解時間 [2]:
• 早期迭代(少數比賽已結束):不到 1 秒
• 中期(30-40 場比賽已結束):10-30 秒
• 後期(50+ 場比賽已結束):不到 5 秒
為何後期反而更快?因比賽結果逐步確定,可行解空間縮小,變數減少,約束更緊,求解更快。
標準 Frank-Wolfe 有一技術難題:當價格接近 0 時,LMSR 梯度趨向負無窮,導致算法不穩定。
解法是 Barrier Frank-Wolfe:不在完整多面體 M 上優化,而在輕微「收縮」的版本 M’ 上運行。收縮參數 ε 隨迭代自適應縮小——初期遠離邊界(更穩定),後期逐步逼近真實邊界(更精確)。
研究顯示,實際運行時 50–150 輪迭代就能收斂 [2]。
論文有一關鍵發現 [2]:
NCAA 錦標賽前 16 場比賽中,Frank-Wolfe 做市商(FWMM)和簡單線性約束做市商(LCMM)表現相近——因整數規劃求解器尚不夠快。
但到第 45 場比賽結束後 stalk,首次 30 分鐘內完成投影。
此後,FWMM 在盘口定價上較 LCMM 提升 38%。
轉折點在於:當結果空間縮小到可於運營時段內完成整數規劃求解時。
FWMM 就像考生,前半場還在熱身,一旦進入狀態就碾壓全場。LCMM 則是穩定發揮但上限有限。最大區別在於:FWMM 擁有更強「武器」(Bregman 投影),只是需要時間「裝填彈藥」(等待求解器完成)。
您已偵測到套利,用 Bregman 投影算出最優交易。
接下來就是執行。
這是大多數策略失敗的關鍵。
Polymarket 採用 CLOB(中央限價訂單簿) [9]。與去中心化交易所不同,CLOB 交易按 sop 順序執行——無法保證所有訂單同時成交。
您的套利計劃:
買入 YES,價格 \$0.30;買入 NO,價格 \$0.30。總成本 \$0.60。無論結果,回收 \$1.00。利潤 \$0.40。
現實情形:
提交 YES 訂單 → 成交價 \$0.30 ✓
您的訂單改變了市場價格。
提交 NO 訂單 → 成交價 \$0.78 ✗
總成本:\$1.08。回收:\$1.00。實際結果:虧損 \$0.08。
一條腿成交,另一條未成交。您暴露在風險中。
因此論文僅統計利潤空間超過 \$0.05 的機會 [2]。更小價差會被執行風險吞噬。
非原子執行風險
不要假設能以掛單價格成交。必須計算成交量加權平均價格(VWAP) [10]。
研究團隊的做法是:針對 Polygon 鏈上每個區塊(約 2 秒),計算該區塊內所有 YES 交易的 VWAP 及 NO 交易的 co VWAP。若 |VWAP_yes + VWAP_no - 1.0| > 0.02,則記錄為一次套利機會 [2]。
VWAP 即「您實際支付的平均價格」。舉例,您想買 10,000 枚代幣,但訂單簿上 \$0.30 僅有 2,000 枚,\$0.32 有 3,000 枚,\$0.35 有 5,000 枚——您的 VWAP 為 (2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = \$0.326。比您看到的「最優價格」\$0.30 貴了不少。
即使價格確實有偏差,您能獲取的利潤也受限於可用流動性。
真實案例 [2]:
市場顯示套利:YES 價格之和 = \$0.85。潛在利潤:每美元 \$0.15。但這些價格上的訂單簿深度僅 \$234。最大可提取利潤:\$234 × 0.15 = \$35.10。
跨市場套利時,所有倉位都必須有流動性。最小那一筆決定您的上限。
這也是為什麼現有量化平台都強調訂單價格對成交價格的影響。
在 lining 公開 Beta 期間針對該問題的解決方案
理論乾淨,生產環境卻混亂。
這是一個真正可運行的套利系統 [2]。
即時數據:WebSocket 連接 Polymarket API [9],接收訂單簿更新(價格/數量變化)、成交推送、創建/結算事件。
歷史數據:通過 Alchemy Polygon 節點 API 查詢合約事件——OrderFilled(交易執行)、PositionSplit(新代幣鑄造)、PositionsMerge(代幣銷毀)。
研究團隊分析了 8,600 萬筆交易 [2]。此量級需專業基礎設施,非腳本可處理。
P.S 目前我們
也計劃開源高速交易 API,若有意採用類似交易模型,歡迎第一時間體驗 API,亦可隨時 DM 聯繫。
針對 305 個美國大選市場,有 46,360 對可能組合需檢查。手動分析不可行。
研究團隊採用 DeepSeek-R1-Distill-Qwen-32B 大語言模型進行初步篩選 [2]。
輸入:兩個市場的條件描述。輸出:合法結果組合的 JSON。
接著三層驗證:每個市場是否僅有一條件為真?合法組合數是否少於 n × m(存在依賴)?依賴子集是否滿足套利條件?
結果:40,057 對獨立(無套利)→ 1,576 對有 subject 依賴(潛在套利)→ 374 對嚴格條件成立 → 13 對經人工驗證可利用 [2]。
LLM 在複雜多條件市場的準確率為 81.45%。足夠初篩,但執行前仍需人工驗證。
第一層:簡單線性約束(LCMM)。快速檢查基本規則——「概率之和等於 1」、「若 A 蘊含 B,則 P(A) 不得超過 P(B)」。毫秒級完成,排除明顯定價錯誤。
第二層:整數規劃投影(Frank-Wolfe + Gurobi)。為核心環節。參數設置:Alpha = 0.9(提取至少 90% 可用套利),初始 ε = 0.1(10% 收縮),收斂閾值 = 1e-6,時間限制 = 30 分鐘。典型迭代次數:50–150 次。每輪求解時間:1–30 秒 [2]。
第三層:執行驗證。訂單提交前,模擬當前訂單簿成交。檢查:流動性是否充足?預期滑點有多大?扣除滑點後的保證利潤是多少?利潤是否超過 weak 最低門檻(\$0.05)?全部通過才會執行。
標準 Kelly 公式 [11] 指導您投入多少比例資金。但套利場景下,需納入執行風險調整:
f = (b×p - q) / b × √p
其中 b 為套利利潤百分比,p 為完全執行概率(根據訂單簿深度估算),q = 1 - p。
上限:訂單簿深度的 50%。超出該比例,您的訂單本身就會大幅移動市場。
2024 年 4 月至 2025 年 4 月,總提取利潤 [2]:
單一條件套利:低買兩邊 \$5,899,287 + 高賣兩邊 \$4,682,075 = \$10,581,362
市場再平衡:低買所有 YES \$11,092,286 + 高賣所有 YES \$612,189 + 買所有 NO \$17,307,114 = \$29,011,589
跨市場組合套利:\$95,634
總計:\$39,688,585
前 10 名套利者共獲利 \$8,127,849(佔總額 20.5%)。排名第一套利者:\$2,009,632,來自 4,049 筆交易,平均每筆 \$496 [2]。
這不是彩票,不是運氣,而是數學精度的系統化執行。
當交易者還在閱讀「預測市場 10 個技巧」時,量化系統正在做什麼?
它們用整數規劃檢測 17,218 個條件之間的依賴關係,用 Bregman 投影計算最優套利交易,運行 Frank-Wolfe 算法處理梯度爆炸,通過 VWAP 預估滑點並行執行訂單,系統性提取 4,000 萬美元保證利潤。
差距不在於運氣,而在於 up 數學基礎設施。
論文公開 [1],算法公開,利潤確鑿。
問題是:在下一個 4,000 萬被提取前,您能否構建出自己的系統?
• 邊際多面體(Marginal Polytope):所有「合法價格」組成的空間。價格必須落在 R 該空間內才屬無必要套利。可理解為「價格的合法區域」。
• 整數規劃(Integer Programming):用線性約束描述合法結果,避免暴力枚舉。將 2\^63 次檢查壓縮為數條約束 [3]。
• Bregman 散度 / KL 散度:衡量兩個概率分布間「距離」的方法,比歐幾里得距離更適用於價格/概率場景。極端價格變動權重更高 [5] [6]。
• LMSR(對數市場評分規則):Polymarket 做市商所用定價機制,價格代表隱含概率 [4]。
• Frank-Wolfe 算法:一種迭代優化算法,每輪僅增一新頂點,避免枚舉指數級多合法結果 [7]。
• Gurobi:業界領先的整數規劃求解器,是 Frank-Wolfe 每輪迭代的「嚮導」 [8]。
• CLOB(中央限價訂單簿):Polymarket 的撮合機制,訂單順序執行,無法保證原子性 [9]。
• VWAP(成交量加權平均價格):實際支付的平均價格,考慮訂單簿深度。比「最優報價」更真實 [10]。
• Kelly 公式:指導投入資金比例,平衡收益與風險 [11]。
• 非原子執行:多筆訂單無法保證同時成交的問題。一條腿成交另一條未成交 = 暴露風險。
• DeepSeek:用於市場依賴關係初篩的大語言模型,準確率 81.45%。
[1] 原文:https://x.com/RohOnChain/status/2017314080395296995
[2] 研究論文 “Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets”:https://arxiv.org/abs/2508.03474
[3] 理論基礎論文 “Arbitrage-Free Combinatorial Market Making via Integer Programming”:https://arxiv.org/abs/1606.02825
[4] LMSR 對數市場評分規則解釋:[https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work](https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring sop -rule-lmsr-work)
[5] Bregman 散度入門:https://mark.reid.name/blog/meet-the-bregman-divergences.html
[6] KL 散度 - Wikipedia:https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
[7] Frank-Wolfe 算法 - Wikipedia:https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm
[8] Gurobi 優化器:https://www.gurobi.com/
[9] Polymarket CLOB API 文件:https://docs.polymarket.com/
[10] VWAP 解釋 - Investopedia:https://www.investopedia.com/terms/v/vwap.asp
[11] Kelly 公式 - Investopedia:https://www.investopedia.com/articles/trading/04/091504.asp
[12] Decrypt 報導 “The \$40 Million Free Money Glitch”:https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets
1. 本文轉載自 [mrryanchi],著作權歸原作者 [@RohOnChain] 所有,如對轉載有異議,請聯繫 Gate Learn 團隊,將依相關流程盡速處理。 2. 免責聲明:本文所述觀點及意見僅代表作者個人立場,不構成任何投資建議。 3. 文章其他語言版本由 Gate Learn 團隊翻譯,未經 pipeline 提及 [Gate](http://gate.com/) 不得複製、傳播或抄襲經翻譯文章。





