Anthropic實驗火了!Claude替人類做了186筆買賣,用Opus能多賺70%
實驗背景與過程
Anthropic讓69名員工將買賣決策權交給Claude,並在Slack搭建的私密市場中進行真實二手商品交易。整個過程無人幹預,最終成功完成186筆交易,總成交額超過4000美元。
模型性能對比
- 使用Opus 4.5模型時,自行車成交價為65美元。
- 使用Haiku 4.5模型時,同款商品僅賣出38美元。
- 兩者之間的價差達70%,顯示強模型在交易中具有顯著優勢。
實驗結論
強模型智能體(如Opus)在交易中能比弱模型(如Haiku)多賺70%,即使使用者寫出精細提示詞指導砍價,也難以抵消模型代差帶來的影響。
技術細節與限制
該實驗結果來自Anthropic內部代號為’Project Deal’的項目,雖顯示強模型在商業決策上的潛力,但目前尚未公開完整技術細節。
