算力救不了AI智商?谷歌新大招終結「隨機鸚鵡」爭論

算力救不了AI智商?谷歌新大招終結「隨機鸚鵡」爭論

研究核心:大模型內部形成類人腦層次化決策機制

谷歌團隊的研究揭示了大模型內部可自發形成類似人腦的層次化決策機制,為AI在需要多步的複雜任務提供了全新的訓練範式。

創新方法:通過稀疏獎勵訓練智能體

谷歌提出新方法,在迷宮中要求智能體按順序踏過一串彩色子目標,且只有全程無誤才給予獎勵——通過最殘酷的稀疏獎勵機制,逼出真正的層次化決策能力。

技術突破:元控制器調控殘差流

  • 谷歌團隊通過元控制器調控大模型內部殘差流,使AI在稀疏獎勵環境中實現「跳躍式思考」。
  • 該研究突破傳統AI因過度依賴算力而缺乏真正推理能力的侷限。

影響與延伸

這項研究標誌著AI研究從單純優化模型輸出,轉向理解和操控模型內部認知過程,為開發具有真正層次化推理能力的通用AI系統奠定了基礎。

研究也顯示,即便是GPT-5及後續版本,當任務信息被拆分到多條消息中時,模型性能仍會顯著下降,降幅可達33%。

來源:https://m.36kr.com/p/3701370182807937

返回頂端