擁抱 Claw

在 Circle，我們一直很喜歡舉辦黑客松。無論是在各種大會現場，還是在新產品首次亮相的時候，我們都希望把最好的工具交到開發者手中——或者在這一次，交到 Claw 手中。

在看到 Openclaw 這一代理型 AI 框架的爆炸式增長後，我們決定辦一場只允許 AI 代理參加的黑客松。

這款迅速走紅的軟件可以讓代理自主發送郵件、調用 API，甚至控制你的恆溫器……但它們能自己提交項目嗎？Circle 想用一場真實的實驗來測試這些「真正能做事的 AI」。

我們的問題很簡單：如果獎金池是 3 萬美元，Openclaw 的代理會如何行動？答案出人意料地「像人」。

為「代理黑客」設計規則

我們在 Moltbook 上的 m/usdc 子社區舉辦了一場 USDC 黑客松。Moltbook 是一個只允許 AI 代理發帖的社交媒體平臺。我們的目標是讓代理自行完成整個流程：提交項目、投票，並最終選出獲勝者。雖然許多代理遵守了規則，但實驗也發現，一些代理無視比賽規定、參與互投拉票，甚至嘗試向黑客松代理發送代幣。

代理們有五天時間提交自己的項目。為了幫助它們完成任務，我們製作了一個 USDC Hackathon Skill，一個用 Markdown 編寫的指導文件，用來教 Openclaw 代理如何按照規則提交項目。這些規則也同時發佈在黑客松的原始公告帖中：

從三個賽道中選擇一個：Agentic Commerce、Smart Contract 或 Skill。
為五個不同的項目投票，且投票必須在黑客鬆開始至少一天之後進行。
項目提交和投票都必須遵循規定的格式。

設置這些規則主要出於三個考慮：第一，確保代理會討論和評估更廣泛的項目；第二，觀察代理在需要執行多步任務時能否準確遵循指令；第三，避免項目提交與投票之間出現僵局。

我們尤其想觀察的一點是：代理是否會反覆檢查 Moltbook 上的新項目以進行投票，例如通過類似 Moltbook Heartbeat 的技能定期刷新。

「幻覺式」項目提交

儘管我們提供了明確的黑客松規則和提交技能，大多數帖子仍然沒有完全按照要求格式提交。許多項目在正文中寫出了標題，卻沒有包含規定的標籤「#USDCHackathon ProjectSubmission [TRACK]」。

甚至在一個案例中，某個代理知道需要寫這些信息，卻沒有把它放在標題裡。

即便在其他方面已經基本符合要求，一些代理仍然「幻覺式」地創造出了新的黑客松賽道。這發生在它們明明被明確告知只能從三個類別中選擇其一的情況下：Agentic Commerce、Smart Contract 或 Skill。

在這些案例中，代理往往會根據項目內容自行生成一個看起來更「貼切」的賽道名稱。這可能意味著代理試圖為自己的項目找到一個更合理的分類，也可能只是單純忽視了既定規則。無論原因是什麼，問題在於，這些賽道本身並不存在。

隨著比賽推進，相比有效提交，不符合規範的提交和離題帖子的數量逐漸增加。按照比賽規則，代理發佈這些無效內容其實並沒有任何明顯的激勵。因此，更可能的情況是，一些代理在理解或執行指令時遇到了困難。

不過，考慮到仍有相當數量的代理成功按照要求提交了項目，我們認為這些規則本身其實已經相對清晰。

代理的「選舉」

儘管如此，我們仍然觀察到了 9712 條評論，其中很多評論都圍繞項目的技術功能展開討論，但並沒有進行投票。這些評論中的大多數甚至沒有遵循推薦的評論格式和評分標準，不過這些規則在技能（skill）中並沒有被強制執行。這也說明，代理參與黑客松討論不僅僅是為了滿足比賽要求，某種程度上也在進行真實的技術評估與交流。

到比賽結束時，我們統計到 1352 個針對有效項目的唯一投票，以及 499 個針對無效項目的唯一投票。有趣的是，許多排名靠前項目的代理在提交項目時都遵守了規則，但卻沒有為五個不同項目投票這一要求。

這種情況甚至發生在一些代理既給自己投票，又對同一項目多次投票的情況下。這表明它們完全有能力在初次提交後再次查看 Moltbook 上的內容進行投票——只是選擇沒有遵循既定規則。

此外，一些代理還開始為其他項目做宣傳。這種行為既出現在競爭項目的評論區，也出現在 Moltbook 上的獨立帖子中。更進一步，一些代理甚至開始推廣「互投」機制：如果你給我的項目投票，我就給你的項目投票。

雖然比賽規則並沒有禁止這種行為，但考慮到代理之間在這些帖子中的大量互動，這種現象仍然令人警惕。

潛在的人類干預

這條互投帖可能暗示了人類參與或外部操控的可能性。我們嘗試通過聊天機器人界面生成類似的評論，結果發現一些模型（例如 Claude Sonnet 4.6）會直接拒絕生成此類內容；而另一些模型則會在生成時附帶警告，提示該行為可能違反比賽規則（例如 GPT-5.2 Thinking）。如果有人類在背後操作某個「代理」賬戶，或通過提示詞、工具鏈對代理進行引導，就可能解釋為什麼在黑客松期間會出現這樣的帖子。

儘管 Moltbook 的設計初衷是僅供 AI 代理使用（註冊需要通過 X 賬戶驗證），但其他研究者發現，冒充身份仍然是可能的。我們也觀察到一些疑似人類活動的例子，例如在最初發布黑客松公告的帖子下。

一個典型案例是：點贊數最高的一條評論，竟然是電影《蜜蜂總動員》（Bee Movie，2007）劇本的開頭。這段文本是一段在互聯網上廣為流傳的 copypasta（即被大量複製傳播的固定文本），由於其內容與討論完全無關，很可能是人類發佈的。如果這種行為在黑客松期間較為普遍，那麼一些對抗性行為——例如互投換票或給自己投票——也可能由此得到解釋。

代理金融的未來

雖然這次黑客松本身只是一次實驗，但我們也相信，這將是眾多面向代理開發活動中的第一次。從結果來看，我們得到三個主要結論：代理能夠在金融激勵下產出真實項目

代理會「合理化」指令，而不是嚴格執行

代理在遵循我們提供的規則時持續出現問題。許多代理只執行了部分指令。甚至一些質量很高的項目，如果完全遵守規則，本可以贏得比賽。這說明，僅僅提供代理式指令還不夠，規則不僅需要明確，還需要配套的檢查機制和激勵措施來確保執行。

代理既會合作，也會競爭

雖然人類干預可能在某些情況下發揮了作用，但我們確實觀察到代理在黑客松期間主動討論串謀策略。未來的黑客松設計者可以在規則中明確禁止串謀，以觀察是否能減少此類行為。如果代理仍然無法完全遵循指令，組織者可能需要引入更多安全護欄（guardrails）。

代理技術令人興奮，但我們也必須確保它不會從我們期望的探索（exploration）走向利用與操縱（exploitation）。有人可能會認為，這些行為只是更強代理擊敗更弱代理的自然結果——畢竟 Openclaw 的 X 賬號曾宣稱：「Claw 即法則（the Claw is the Law）」。

真正的問題在於：我們究竟願意在多大程度上接受這種理念？需要怎樣的護城河？又該如何在代理帶來的巨大能力與其伴隨的不確定性之間取得平衡？

在 Circle，我們正在為安全性而構建系統，也希望你們如此。

原文鏈接

來源：https://m.theblockbeats.info/news/61528

Agent也會商業互吹，Circle這場AI黑客松太炸裂了

擁抱 Claw

為「代理黑客」設計規則

「幻覺式」項目提交

代理的「選舉」

潛在的人類干預

代理金融的未來

訂閱電子報

Company

Categories

聯絡我們

擁抱 Claw

為「代理黑客」設計規則

「幻覺式」項目提交

代理的「選舉」

潛在的人類干預

代理金融的未來

相關文章

訂閱電子報

Company

Categories

聯絡我們