Polymarket套利聖經:真正的差距在數學基礎設施
引言
在創立 @insidersdotbot 的過程中,我跟不少高頻做市團隊和套利團隊有過深度的交流,其中,最大的一個需求,就是怎麼做套利策略。
我們的用戶、朋友、合作伙伴,都在探索著 Polymarket 套利這一條複雜且多維度的交易路線。如果你是一個推特的活躍用戶,那麼我相信你也曾經刷到過「我通過 XX 套利策略,從預測市場上賺了多少錢」這樣的推文。
然而,大部分文章都過度簡化了套利的底層邏輯,讓套利變成了「我上我也行」,「用 Clawdbot 就能解決」的交易模式,而並沒有去詳細解釋怎樣系統性地去理解並開發屬於自己的套利系統。
Polymarket 套利並不是簡單的數學問題
你在 Polymarket 上看到一個市場:
YES 價格 $0.62,NO 價格 $0.33。
你心想:0.62 + 0.33 = 0.95,不到 1 塊錢,有套利空間!同時買 YES 和 NO,花 $0.95,無論結果如何都能拿回 $1.00,淨賺 $0.05。
你是對的。
但問題是——當你還在手動算這道加法題的時候,量化系統已經在做一件完全不同的事。
它們在同時掃描 17,218 個條件,跨越 2^63 種可能的結果組合,在毫秒級別內找到所有定價矛盾。等你下完兩筆訂單,價差已經消失了。系統早就在幾十個相關市場裡找到了同樣的漏洞,算好了考慮訂單簿深度和手續費之後的最優倉位大小,並行執行了所有交易,然後把資金轉向了下一個機會。
差距不只是速度。是數學基礎設施。
第一章:為什麼「加法」不夠用——邊際多面體問題
單一市場謬誤
先看一個簡單的例子。
市場 A:「特朗普會贏下賓夕法尼亞洲的選舉嗎?」
YES 價格 $0.48,NO 價格 $0.52。加起來正好 $1.00。
看起來完美,沒有套利空間,對吧?
錯。
加一個市場,問題就來了。
再看市場 B:「共和黨會在賓夕法尼亞洲超越對手 5 個百分點以上嗎?」
YES 價格 $0.32,NO 價格 $0.68。加起來也是 $1.00。
兩個市場各自都「正常」。但這裡有一個邏輯依賴關係:
美國總統大選不是全國一起數票,而是按州計票。每個州是一個獨立的「戰場」,誰在這個州拿到更多選票,誰就贏走這個州所有的選舉人票(贏者通吃)。特朗普是共和黨候選人。所以「共和黨在賓夕法尼亞贏」和「特朗普在賓夕法尼亞贏」——是同一件事。如果共和黨贏了對手 5 個百分點以上,那不僅意味著特朗普贏了賓夕法尼亞,而且贏得很大。
換句話說,市場 B 的 YES(共和黨大勝)是市場 A 的 YES(特朗普獲勝)的一個子集——大勝一定意味著獲勝,但獲勝不一定意味著大勝。
而這種邏輯依賴,就創造了套利機會。
這就像是你在賭兩件事——「明天會下雨嗎」和「明天會有雷暴嗎」。
如果有雷暴,那一定在下雨(雷暴是下雨的子集)。所以「雷暴 YES」的價格不可能比「下雨 YES」的價格高。如果市場定價違反了這個邏輯,你就可以同時買低賣高,賺到「無風險利潤」,這就是套利。
指數爆炸:為什麼暴力搜索行不通
對於任何有 n 個條件的市場,理論上有 2^n 種可能的價格組合。
聽起來還行?來看一個真實案例。
2010 年 NCAA 錦標賽市場 [2]:63 場比賽,每場有贏/輸兩種結果。可能的結果組合數是 2^63 = 9,223,372,036,854,775,808——超過 9 百億億種。市場上有 5000 多個盤口。
2^63 這個數字有多大?如果你每秒檢查 10 億種組合,需要大約 292 年 才能全部檢查完。這就是為什麼「暴力搜索」在這裡完全行不通。
逐一檢查每種組合?計算上不可能。
再看 2024 年美國大選。研究團隊發現了 1,576 對可能存在依賴關係的市場對。如果每對市場各有 10 個條件,那每對需要檢查 2^20 = 1,048,576 種組合。乘以 1,576 對。你的筆記本電腦算完的時候,選舉結果早就出來了。
整數規劃:用約束代替枚舉
量化系統的解決方案不是「更快地枚舉」,而是根本不枚舉。
它們用整數規劃(Integer Programming)來描述「哪些結果是合法的」。
來看一個真實例子。Duke 對 Cornell 的比賽市場:每支球隊有 7 個盤口(0 到 6 場勝利),總共 14 個條件,2^14 = 16,384 種可能組合。
但有一個約束:它們不可能都贏 5 場以上,因為那樣它們會在半決賽相遇(只有一個能晉級)。
整數規劃怎麼處理?三條約束就夠了:
· 約束一:Duke 的 7 個盤口裡,恰好有一個為真(Duke 只能有一個最終勝場數)。
· 約束二:Cornell 的 7 個盤口裡,恰好有一個為真。
· 約束三:Duke 贏 5 場 + Duke 贏 6 場 + Cornell 贏 5 場 + Cornell 贏 6 場 ≤ 1(它們不能同時贏那麼多)。
三條線性約束,替代了 16,384 次暴力檢查。
換言之,暴力搜索就像是把字典裡的每個單詞都讀一遍來找一個詞。整數規劃就像是直接翻到那個字母開頭的頁面。你不需要檢查所有可能性,你只需要描述「合法答案長什麼樣」,然後讓算法去找違反規則的定價。
真實數據:41% 的市場存在套利 [2]
原文中提到,研究團隊分析了 2024 年 4 月到 2025 年 4 月的數據:
• 檢查了 17,218 個條件
• 其中 7,051 個條件存在單一市場套利(佔 41%)
• 中位數定價偏差:$0.60(應該是 $1.00)
• 13 對確認的跨市場可利用套利
中位數偏差 $0.60 意味著市場經常性地偏離 40%。這不是「接近有效」,這是「大規模可利用」。
第二章:Bregman 投影——怎麼算出最優套利交易
為什麼「直線距離」不行
最直覺的想法是:找到離當前價格最近的「合法價格」,然後交易差價。
用數學語言說,就是最小化歐幾里得距離:||μ – θ||²
但這有一個致命問題:它把所有價格變動當成一樣的。
從 $0.50 漲到 $0.60,和從 $0.05 漲到 $0.15,都是漲了 10 美分。但它們的信息含量完全不同。
為什麼?因為價格代表的是隱含概率。從 50% 變到 60%,是一個溫和的觀點調整。從 5% 變到 15%,是一個巨大的信念翻轉——一個幾乎不可能的事件突然變成了「有點可能」。
想象你在稱體重。從 70 公斤變到 80 公斤,你會說「胖了一點」。但從 30 公斤變到 40 公斤(如果你是成年人),那就是「從瀕死變成了嚴重營養不良」。同樣是 10 公斤的變化,意義完全不同。價格也是一樣——越接近 0 或 1 的價格變動,信息量越大。
Bregman 散度:正確的「距離」
Polymarket 的做市商使用的是 LMSR(對數市場評分規則)[4],價格本質上代表概率分佈。
在這種結構下,正確的距離度量不是歐幾里得距離,而是 Bregman 散度。[5]
對於 LMSR,Bregman 散度就變成了 KL 散度(Kullback-Leibler 散度)[6]——一個衡量兩個概率分佈之間「信息論距離」的指標。
你不需要記住公式。你只需要理解一件事:
KL 散度會自動給「極端價格附近的變動」更高的權重。從 $0.05 到 $0.15 的變動,在 KL 散度下比從 $0.50 到 $0.60 的變動「更遠」。這正好符合我們的直覺——極端價格的變動意味著更大的信息衝擊。
一個比較好的例子,就是上次 @zachxbt 的預測市場中,Axiom 在最後關頭反超 Meteora,也是以極端價格變動,作為一切變化的。
套利利潤 = Bregman 投影的距離
這是原文作者參考整篇論文最核心的結論之一:
任何交易能獲得的最大保證利潤,等於當前市場狀態到無套利空間的 Bregman 投影距離。
換人話說:市場價格偏離「合法空間」越遠,能賺的錢越多。而 Bregman 投影會告訴你:
1. 該買賣什麼(投影方向告訴你交易方向)
2. 該買賣多少(考慮訂單簿深度)
3. 能賺多少(投影距離就是最大利潤)
排名第一的套利者一年賺了 $2,009,631.76。[2]他的策略就是比所有人更快、更準地解這道優化題。
第三章:Frank-Wolfe 算法——讓理論變成可執行的代碼
Frank-Wolfe 的核心思想
Frank-Wolfe 算法 [7] 的天才之處在於:它不試圖一次性搞定整個問題,而是一步一步逼近答案。
它的工作方式是這樣的:
第一步:從一個小的已知合法結果集合開始。
第二步:在這個小集合上做優化,找到當前最優解。
第三步:用整數規劃找到一個新的合法結果,加入集合。
第四步:檢查是否足夠接近最優解。如果不夠,回到第二步。
每一輪迭代,集合只增加一個頂點。即使跑了 100 輪,你也只需要追蹤 100 個頂點——而不是 2^63 個。
想象你在一個巨大的迷宮裡找出口。
暴力方法是把每條路都走一遍。Frank-Wolfe 的方法是:先隨便走一條路,然後在每個岔路口問一個「嚮導」(整數規劃求解器):「從這裡開始,哪個方向最可能通向出口?」然後朝那個方向走一步。你不需要探索整個迷宮,只需要在每個關鍵節點做出正確的選擇。
整數規劃求解器:每一步的「嚮導」
Frank-Wolfe 的每一輪迭代都需要解一個整數線性規劃問題。這在理論上是 NP 困難的(也就是「沒有已知的快速通用算法」)。
但現代求解器,比如 Gurobi[8],對於結構良好的問題可以高效求解。
研究團隊用的是 Gurobi 5.5。實際求解時間 :
• 早期迭代(少量比賽已結束):不到 1 秒
• 中期(30-40 場比賽已結束):10-30 秒
• 後期(50+ 場比賽已結束):不到 5 秒
為什麼後期反而更快?因為隨著比賽結果確定,可行解空間在縮小。變量更少,約束更緊,求解更快。
梯度爆炸問題和 Barrier Frank-Wolfe
標準的 Frank-Wolfe 有一個技術問題:當價格接近 0 的時候,LMSR 的梯度會趨向負無窮。這會導致算法不穩定。
解決方案是 Barrier Frank-Wolfe:不在完整的多面體 M 上優化,而是在一個稍微「收縮」的版本 M 上優化。收縮參數 ε 會隨著迭代自適應地減小——開始時離邊界遠一點(穩定),後來逐漸逼近真實邊界(精確)。
研究表明,實際操作中 50 到 150 輪迭代就足夠收斂。
真實表現
論文裡有一個關鍵發現 [2]:
在 NCAA 錦標賽的前 16 場比賽中,Frank-Wolfe 做市商(FWMM)和簡單的線性約束做市商(LCMM)表現差不多——因為整數規劃求解器還太慢。
但在 45 場比賽結束後,第一次成功的 30 分鐘投影完成了。
從那以後,FWMM 在盤口定價上比 LCMM 好了 38%。
轉折點就是:當結果空間縮小到整數規劃能在交易時間窗口內完成求解的時候。
FWMM 就像一個學生,考試前半段還在熱身,但一旦進入狀態,就開始碾壓。LCMM 是那個一直穩定發揮但天花板有限的學生。關鍵區別是:FWMM 有更強的「武器」(Bregman 投影),只是需要時間來「裝彈」(等求解器跑完)。
第四章:執行——為什麼算出來了還可能虧錢
非原子執行問題
Polymarket 使用的是 CLOB(中央限價訂單簿)[9]。跟去中心化交易所不同,CLOB 上的交易是順序執行的——你不能保證所有訂單同時成交。
你的套利計劃:
買 YES,價格 $0.30。買 NO,價格 $0.30。總成本 $0.60。無論結果如何,回收 $1.00。利潤 $0.40。
現實:
一條腿成交,另一條沒成交 = 暴露風險。
VWAP(成交量加權平均價格)
VWAP(成交量加權平均價格)→ 你實際付的平均價格,考慮了訂單簿深度。比「最優報價」更真實 [10]
第五章:最終結果
2024 年 4 月到 2025 年 4 月,總提取利潤:
單一條件套利: 低買兩邊 $5,899,287 + 高賣兩邊 $4,682,075 = $10,581,362
市場再平衡: 低買所有 YES $11,092,286 + 高賣所有 YES $612,189 + 買所有 NO $17,307,114 = $29,011,589
跨市場組合套利: $95,634
總計:$39,688,585
前 10 名套利者拿走了 $8,127,849(總額的 20.5%)。排名第一的套利者:$2,009,632,來自 4,049 筆交易,平均每筆 $496[2]。
不是彩票。不是運氣。是數學精度的系統化執行。
概念速查
• 邊際多面體(Marginal Polytope)→ 所有「合法價格」組成的空間。價格必須在這個空間內才是無套利的。可以理解為「價格的合法區域」
• 整數規劃(Integer Programming)→ 用線性約束描述合法結果,避免暴力枚舉。把 2^63 次檢查壓縮成幾條約束 [3]
• Bregman 散度 / KL 散度 → 衡量兩個概率分佈之間「距離」的方法,比歐幾里得距離更適合價格/概率場景。極端價格附近的變動權重更高 [5][6]
• LMSR(對數市場評分規則)→ Polymarket 做市商使用的定價機制,價格代表隱含概率 [4]
• Frank-Wolfe 算法 → 一種迭代優化算法,每輪只加一個新頂點,避免了枚舉指數級多的合法結果 [7]
• Gurobi → 業界領先的整數規劃求解器,Frank-Wolfe 每輪迭代的「嚮導」[8]
• CLOB(中央限價訂單簿)→ Polymarket 的交易撮合機制,訂單順序執行,不能保證原子性 [9]
• VWAP(成交量加權平均價格)→ 你實際付的平均價格,考慮了訂單簿深度。比「最優報價」更真實 [10]
• Kelly 公式 → 告訴你該把多少比例的資金投入一筆交易,平衡收益和風險 [11]
• 非原子執行 → 多筆訂單不能保證同時成交的問題。一條腿成交另一條沒成交 = 暴露風險
• DeepSeek → 用來做市場依賴關係初篩的大語言模型,準確率 81.45%
參考資料
[2] 研究論文「Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets」
[3] 理論基礎論文「Arbitrage-Free Combinatorial Market Making via Integer Programming」
[7] Frank-Wolfe 算法 – Wikipedia
