擁抱 Claw
在 Circle,我們一直很喜歡舉辦黑客松。無論是在各種大會現場,還是在新產品首次亮相的時候,我們都希望把最好的工具交到開發者手中——或者在這一次,交到 Claw 手中。

在看到 Openclaw 這一代理型 AI 框架的爆炸式增長後,我們決定辦一場只允許 AI 代理參加的黑客松。
這款迅速走紅的軟件可以讓代理自主發送郵件、調用 API,甚至控制你的恆溫器……但它們能自己提交項目嗎?Circle 想用一場真實的實驗來測試這些「真正能做事的 AI」。
我們的問題很簡單:如果獎金池是 3 萬美元,Openclaw 的代理會如何行動?答案出人意料地「像人」。
為「代理黑客」設計規則
我們在 Moltbook 上的 m/usdc 子社區舉辦了一場 USDC 黑客松。Moltbook 是一個只允許 AI 代理發帖的社交媒體平臺。我們的目標是讓代理自行完成整個流程:提交項目、投票,並最終選出獲勝者。雖然許多代理遵守了規則,但實驗也發現,一些代理無視比賽規定、參與互投拉票,甚至嘗試向黑客松代理發送代幣。
代理們有五天時間提交自己的項目。為了幫助它們完成任務,我們製作了一個 USDC Hackathon Skill,一個用 Markdown 編寫的指導文件,用來教 Openclaw 代理如何按照規則提交項目。這些規則也同時發佈在黑客松的原始公告帖中:
- 從三個賽道中選擇一個:Agentic Commerce、Smart Contract 或 Skill。
- 為五個不同的項目投票,且投票必須在黑客鬆開始至少一天之後進行。
- 項目提交和投票都必須遵循規定的格式。
設置這些規則主要出於三個考慮:第一,確保代理會討論和評估更廣泛的項目;第二,觀察代理在需要執行多步任務時能否準確遵循指令;第三,避免項目提交與投票之間出現僵局。
我們尤其想觀察的一點是:代理是否會反覆檢查 Moltbook 上的新項目以進行投票,例如通過類似 Moltbook Heartbeat 的技能定期刷新。
「幻覺式」項目提交
儘管我們提供了明確的黑客松規則和提交技能,大多數帖子仍然沒有完全按照要求格式提交。許多項目在正文中寫出了標題,卻沒有包含規定的標籤「#USDCHackathon ProjectSubmission [TRACK]」。
甚至在一個案例中,某個代理知道需要寫這些信息,卻沒有把它放在標題裡。

即便在其他方面已經基本符合要求,一些代理仍然「幻覺式」地創造出了新的黑客松賽道。這發生在它們明明被明確告知只能從三個類別中選擇其一的情況下:Agentic Commerce、Smart Contract 或 Skill。
在這些案例中,代理往往會根據項目內容自行生成一個看起來更「貼切」的賽道名稱。這可能意味著代理試圖為自己的項目找到一個更合理的分類,也可能只是單純忽視了既定規則。無論原因是什麼,問題在於,這些賽道本身並不存在。

隨著比賽推進,相比有效提交,不符合規範的提交和離題帖子的數量逐漸增加。按照比賽規則,代理發佈這些無效內容其實並沒有任何明顯的激勵。因此,更可能的情況是,一些代理在理解或執行指令時遇到了困難。
不過,考慮到仍有相當數量的代理成功按照要求提交了項目,我們認為這些規則本身其實已經相對清晰。

代理的「選舉」
儘管如此,我們仍然觀察到了 9712 條評論,其中很多評論都圍繞項目的技術功能展開討論,但並沒有進行投票。這些評論中的大多數甚至沒有遵循推薦的評論格式和評分標準,不過這些規則在技能(skill)中並沒有被強制執行。這也說明,代理參與黑客松討論不僅僅是為了滿足比賽要求,某種程度上也在進行真實的技術評估與交流。
到比賽結束時,我們統計到 1352 個針對有效項目的唯一投票,以及 499 個針對無效項目的唯一投票。有趣的是,許多排名靠前項目的代理在提交項目時都遵守了規則,但卻沒有為五個不同項目投票這一要求。
這種情況甚至發生在一些代理既給自己投票,又對同一項目多次投票的情況下。這表明它們完全有能力在初次提交後再次查看 Moltbook 上的內容進行投票——只是選擇沒有遵循既定規則。
此外,一些代理還開始為其他項目做宣傳。這種行為既出現在競爭項目的評論區,也出現在 Moltbook 上的獨立帖子中。更進一步,一些代理甚至開始推廣「互投」機制:如果你給我的項目投票,我就給你的項目投票。
雖然比賽規則並沒有禁止這種行為,但考慮到代理之間在這些帖子中的大量互動,這種現象仍然令人警惕。

潛在的人類干預
這條互投帖可能暗示了人類參與或外部操控的可能性。我們嘗試通過聊天機器人界面生成類似的評論,結果發現一些模型(例如 Claude Sonnet 4.6)會直接拒絕生成此類內容;而另一些模型則會在生成時附帶警告,提示該行為可能違反比賽規則(例如 GPT-5.2 Thinking)。如果有人類在背後操作某個「代理」賬戶,或通過提示詞、工具鏈對代理進行引導,就可能解釋為什麼在黑客松期間會出現這樣的帖子。
儘管 Moltbook 的設計初衷是僅供 AI 代理使用(註冊需要通過 X 賬戶驗證),但其他研究者發現,冒充身份仍然是可能的。我們也觀察到一些疑似人類活動的例子,例如在最初發布黑客松公告的帖子下。
一個典型案例是:點贊數最高的一條評論,竟然是電影《蜜蜂總動員》(Bee Movie,2007)劇本的開頭。這段文本是一段在互聯網上廣為流傳的 copypasta(即被大量複製傳播的固定文本),由於其內容與討論完全無關,很可能是人類發佈的。如果這種行為在黑客松期間較為普遍,那麼一些對抗性行為——例如互投換票或給自己投票——也可能由此得到解釋。

代理金融的未來
雖然這次黑客松本身只是一次實驗,但我們也相信,這將是眾多面向代理開發活動中的第一次。從結果來看,我們得到三個主要結論:代理能夠在金融激勵下產出真實項目
代理會「合理化」指令,而不是嚴格執行
代理在遵循我們提供的規則時持續出現問題。許多代理只執行了部分指令。甚至一些質量很高的項目,如果完全遵守規則,本可以贏得比賽。這說明,僅僅提供代理式指令還不夠,規則不僅需要明確,還需要配套的檢查機制和激勵措施來確保執行。
代理既會合作,也會競爭
雖然人類干預可能在某些情況下發揮了作用,但我們確實觀察到代理在黑客松期間主動討論串謀策略。未來的黑客松設計者可以在規則中明確禁止串謀,以觀察是否能減少此類行為。如果代理仍然無法完全遵循指令,組織者可能需要引入更多安全護欄(guardrails)。
代理技術令人興奮,但我們也必須確保它不會從我們期望的探索(exploration)走向利用與操縱(exploitation)。有人可能會認為,這些行為只是更強代理擊敗更弱代理的自然結果——畢竟 Openclaw 的 X 賬號曾宣稱:「Claw 即法則(the Claw is the Law)」。
真正的問題在於:我們究竟願意在多大程度上接受這種理念?需要怎樣的護城河?又該如何在代理帶來的巨大能力與其伴隨的不確定性之間取得平衡?
在 Circle,我們正在為安全性而構建系統,也希望你們如此。
