谷歌DeepMind首發AGI終極考綱,20萬全球懸賞,撕下所有大模型偽裝
提出AGI認知評估框架
DeepMind提出通用人工智能(AGI)的認知評估框架,將通用智能拆解為10大核心能力維度,並設計一套三階段評估協議,以系統性地衡量AI在真實世界中的認知表現。
設立全球懸賞計劃
為推動AGI評測方案的落地,DeepMind聯合Kaggle設立20萬美元懸賞,向全球科研團隊徵集可行的評測方案,旨在打破現有大模型評估的侷限性。
挑戰大模型偽裝
該框架明確指出當前多數大模型存在“認知偽裝”問題,即表面具備複雜推理能力,實則缺乏真實世界中的理解與適應能力,因此提出以多維度能力評估來“撕下所有大模型偽裝”。
相關延伸觀點
- AGI非單一超級智能體:有觀點指出,AGI可能並非由單一超級智能體構成,而是由多個系統“拼湊”而成,挑戰傳統對AGI的全知全能認知。
- 視頻推理突破:框架強調打破“先看後想”的慣性,實現真正的“邊看邊想”推理,提升AI在動態場景中的理解能力。
- 實際應用探索:當AI首次讀完整本基因之書時,十億參數的單細胞大模型能實現哪些實際功能,成為研究重點之一。
