模型不是壁壘,Agent Harness 才是:11 組件+ 7 決策完整拆解

模型不是壁壘,Agent Harness 才是:11 組件+ 7 決策完整拆解

核心觀點

文章的核心結論就一句話:你花大價錢買的模型不是壁壘,你搭的那套Harness 才是。

Harness 的本質

Harness 不是已解決的技術,也不是商品化層。它是硬工程所在的地方:它決定了模型如何被調用、如何與外部系統交互、如何管理任務流程。

實際效能差異

同一個模型,換一套運行環境,編程基準的成功率就從42% 跳到了78%。這個數據來自Nate B Jones 的一項研究,只有一個變量:模型本身未變,改變的是運行環境。

數據反饋機制

Harness 跑的每一次Agent 任務都在產生數據——成功的路徑、失敗的模式、工具調用的序列。這些數據可以反饋回訓練,讓下一代模型更適配Harness 環境。

行業趨勢與競爭

在AI Agent領域,框架本身技術壁壘低,暗藏Eval數據飛輪等多層隱性壁壘。大模型技術架構趨同、技術原理透明化下,真正拉開差距的是Harness 的工程設計與優化能力。

工程經驗優勢

它更像一種工程經驗優勢,而不是一種難以逾越的結構性壁壘。也就是說,Harness 很重要,但它更像一個窗口期紅利,而不是永久護城河。

類比說明

沒有操作系統的CPU 就是一堆晶體管,什麼也幹不了。同樣,沒有Harness 的大模型就是一個孤立的推理引擎。它很聰明,但它不知道該記住什麼、忘掉什麼,也不知道如何與現實世界交互。

來源:https://zhuanlan.zhihu.com/p/2025242722336809333

返回頂端