算力救不了AI智商？谷歌新大招終結「隨機鸚鵡」爭論

研究核心：大模型內部形成類人腦層次化決策機制

谷歌團隊的研究揭示了大模型內部可自發形成類似人腦的層次化決策機制，為AI在需要多步的複雜任務提供了全新的訓練範式。

谷歌提出新方法，在迷宮中要求智能體按順序踏過一串彩色子目標，且只有全程無誤才給予獎勵——通過最殘酷的稀疏獎勵機制，逼出真正的層次化決策能力。

這項研究標誌著AI研究從單純優化模型輸出，轉向理解和操控模型內部認知過程，為開發具有真正層次化推理能力的通用AI系統奠定了基礎。

研究也顯示，即便是GPT-5及後續版本，當任務信息被拆分到多條消息中時，模型性能仍會顯著下降，降幅可達33%。