史丹佛發布 2026 年 AI 指數報告,揭曉全球 AI 權力版圖劇變
中美 AI 差距幾乎抹平,僅剩 2.7%
史丹佛「2026 年 AI 指數報告」於 4 月 13 日重磅出爐,這份長達 423 頁的報告全面揭示了全球 AI 產業的最新格局。報告指出,中美 AI 模型性能差距已基本消失,雙方在頂峰對決中頻繁易主,目前美國 Anthropic 的領先優勢僅剩 2.7%。
報告將 2023 年 5 月以來 Arena 榜單上的美國第一與中國第一畫在同一座標系中。2023 年 5 月,gpt-4-0314 以 1320 分領跑,中國當時仍為 chatglm-6b,差距達 300 多分。到了 2025 年 2 月,DeepSeek-R1 首次與美國頭部模型短暫打平。至 2026 年 3 月,美國 Claude Opus 4.6 拿到 1503 分,中國 dola-seed-2.0-preview 拿到 1464 分,差距僅 39 分。
數量上,2025 年美國發布 50 個顯著模型,中國緊隨其後發布 30 個。全球 TOP 5 由 OpenAI、谷歌、阿里、Anthropic、xAI 五五分賬;TOP 10 中中國機構與企業佔據四席,包括阿里、DeepSeek、清華、字節。
AI 進化無瓶頸,90% 頂尖模型出自產業界
報告強調,AI 的進化並未遭遇所謂「瓶頸」,反而以史無前例的速度狂飆。過去一年,全球超 90% 的頂尖模型在博士級科學問題、多模態推理、競賽數學上的表現,追平甚至超越了人類。特別是在代碼能力上,SWE-bench 成績在一年內從 60% 飆升至近 100%。
數據顯示,去年發布的 95 個最具代表性的模型中,超過九成來自產業界,而非學術機構或政府實驗室。發布速度也在加速,僅 2026 年 2 月一個月,就有 Gemini 3.1 Pro、Claude Opus 4.6、GPT-5.3 Codex 等八九個旗艦模型同月入場。
能力呈現「鋸齒前沿」,能拿奧賽金牌卻看不懂模擬時鐘
儘管 AI 能力飛速提升,但其發展呈現出嚴重的「偏科」現象,研究者將其命名為「鋸齒前沿」(jagged frontier)。最強模型能在數學奧林匹克(IMO)拿金牌,但在讀模擬時鐘任務上的正確率僅為 50.1%。
此外,AI 在實驗室仿真環境(RLBench)的操作成功率達 89.4%,但搬到真實家庭場景完成洗碗、疊衣服等家務,成功率僅 12%。在專門評估科研邏輯的 PaperArena 測試中,最強 AI 加持的 Agent 得分僅 39%,僅有博士生一半的功力。
就業市場受衝擊,22-25 歲開發者就業下滑 20%
報告指出,AI 搶飯碗的事實已從預測變成現實,最先遭殃的是年輕「打工人」。22 到 25 歲的軟體開發者群體,從 2024 年至今,就業人數下降了約 20%。同期,年紀更大的同行群體反而在增長。企業高管普遍預期,未來的裁員幅度將比過去幾個月更大。
全球 AI 投資激增,美國一騎絕塵,但人才流入減少
2025 年全球企業 AI 投資達到 5817 億美元,同比增長 130%。其中美國私募 AI 投資 2859 億美元,一年新增 1953 家 AI 創業公司,是排名第二國家的 10 倍以上。
然而,美國的另一項核心資源正在反向流動。2017 年至今,進入美國的 AI 研究人員和開發者數量下降了 89%,且下降趨勢在加速,僅過去一年就下降了 80%。這顯示出錢在加速湧向美國,但人才流入的水龍頭正在擰緊。
算力命門集中,中國職場 AI 使用率全球領先
從 2021 年至今,全球 AI 算力總量漲了 30 倍。英偉達一家的 GPU 佔據了全世界 AI 算力的 60% 以上,而這些芯片幾乎都來自代工廠臺積電。全球 AI 數據中心的總功率已達 29.6 GW,相當於紐約州在用電高峰時段的總用電需求。
在應用普及率方面,2025 年全球 58% 的員工在工作中開始經常性使用 AI。但中國、印度、尼日利亞等國的職場 AI 滲透率超過 80%,中國的職場 AI 滲透率比全球平均高出 20 個百分點以上。
專家與公眾觀感撕裂,信任度差異顯著
隨著 AI 能力增強,專家與公眾的觀感差距擴大。全球範圍內,認為 AI 利大於弊的比例從 52% 上升到 59%,但對 AI 感到緊張的比例從 50% 上升到 52%。最分裂的是美國,只有 33% 的美國人認為 AI 會讓自己的工作變得更好,且對政府監管 AI 的信任度僅為 31%,為受訪國家中最低。
