當Token變成勞動力,人就變成了接口
外掛的遙控器不在你手裡
GTC 那一週,黃仁勳做客 All-In Podcast,說了一句殺傷力更大的話。「假設你有一個年薪 50 萬美元的工程師。如果他沒有消耗至少 25 萬美元的 Token,我會非常擔憂。」
主持人追問 NVIDIA 是否在為工程團隊花 20 億美元買 Token,黃仁勳答:「我們正在努力。」
一個不燒 Token 的工程師,50 萬也不值 50 萬。
NVIDIA 的方案很直接,往薪酬包裡塞 Token。黃仁勳在 GTC 主題演講上說,未來 NVIDIA 每個工程師都會有一筆年度 Token 預算,大約是基本工資的一半。
一個拿滿額 Token 預算的人,等於全天候有十幾個 AI agent 幫他寫代碼、跑測試、搜文獻、做仿真。一個只有免費版 API 額度的人,還在靠雙手敲鍵盤。兩個人簡歷可能一模一樣,產出差 5 到 10 倍。
這在硅谷已經不是理論了。
今年 3 月,Business Insider 報道了一個變化:工程師面試時開始問「這個崗位配多少 Token 預算?」Theory Ventures 的合夥人 Tomasz Tunguz 把 Token 預算叫工程師薪酬的「第四支柱」,排在底薪、獎金、股權後面。OpenAI 總裁 Greg Brockman 的話更直接:你能調用多少推理算力,將越來越決定你的整體生產力。
黃仁勳在 GTC 演講裡自己也說了:「有多少 Token 跟著我的崗位走?這已經是硅谷的招聘工具了。」
1950 年代,底特律汽車工人的工資在全美名列前茅。真正讓他們過上中產生活的,是亨利·福特發明的流水線。工人站在線上,線動人不動,每個人的產出被機械臂放大了幾十倍。一個底特律工人的生活水準遠超同期的手工匠人,手藝未必更好,但他腳下踩的是一條更粗的流水線。
2026 年的 Token 預算,就是 1950 年的流水線。
但有一個區別。
底特律工人離開福特,可以去通用,可以去克萊斯勒,流水線哪兒都有。工會能跟資方談判,要求更好的線速和更安全的環境。
Token 預算不一樣。公司給你那天你是超人,收回那天你變回路人。股票能套現帶走,技能能跟著你跳槽。Token 預算什麼都不是,就是外掛,開關在公司手裡。
硅谷已經有了一個新詞來形容這種處境,叫「GPU 飢渴」。
頂級 AI 研究員跳槽,薪資差距已經排到第二位了,排第一的是算力。跑不了實驗,部署不了 agent,能力被配額卡死。「你們給多少 Token」有時候排在股票前面。股票是一張可能跌的遠期支票,Token 預算是今天就能兌現的生產力。
而不用 AI 的人,直接出局。
Goldman Sachs 估算 AI 可能自動化美國 25% 的工時。Mercer 調查說 65% 的高管預期兩到三成的員工會因 AI 被重新配置。兩組數字疊在一起,結論很清楚:有 Token 的人產出爆炸,沒有 Token 的人被優化掉。
分界線是 Token 配額,和人的能力,關係越來越小。
Token 吞吐量就是估值
個人的價值由 Token 配額決定。公司呢?
2026 年 3 月初,一家叫 MiniMax 的上海公司發了上市以來的第一份年報。全年營收 7900 萬美元,調整後淨虧損 2.5 億 2.5 億。按傳統財務指標看,這是一家燒錢的小公司,營收只有 Accenture 一個季度的零頭。
但資本市場不這麼看它。
MiniMax 的 CEO 閆俊傑在財報電話會上說了一句話,比整份財報都重要:「公司的價值,由智能密度乘以 Token 吞吐量決定。」
Token 吞吐量,不是營收增速,不是用戶數,不是毛利率。
支撐這句話的數據很硬。2026 年 2 月,MiniMax 的 M2 系列模型日均 Token 消耗量,比兩個月前的 12 月漲了 、編程場景的 Token 消耗漲了 10 倍。在 AI 模型聚合平臺 OpenRouter 上,MiniMax 的 M2.5 兩週消耗了 4.55 萬億 Token,把美國的模型全部擠下去,一家上海公司第一次登上全球 Token 消耗排行榜的榜首。
《南華早報》報道這件事時用了一個說法:中國的開源模型終結了美國開發者長達一年的市場統治。終結靠的是什麼?Token 消耗量。誰的 Token 被燒得最多,誰就是贏家。
這個邏輯放到 OpenAI 身上也成立。OpenAI 的 API 平臺每分鐘處理 60 億 Token,兩年漲了 20 倍。年消費超 10 萬美元的企業客戶,一年翻了將近 7 倍。Barclays 分析師 Ross Sandler 拆了一遍數據後得出結論:OpenAI 在消費端的 Token 消耗量是 Google Gemini 的兩倍以上。
Token 消耗量,成了給 AI 公司排座次的硬通貨。
更有意思的是這件事在公司內部的樣子。紐約時報最近報道了一個叫「tokenmaxxing」的現象:Meta 和 OpenAI 的工程師在內部排行榜上比拼誰消耗的 Token 多。
Token 預算正在變成標配福利,就像十年前的免費午餐和牙科保險。一個在愛立信斯德哥爾摩辦公室工作的工程師告訴紐約時報,他花在 Claude 上的錢可能比他工資還高,但公司買單。
TechCrunch 上週的一篇文章算了一筆賬:一個工程師下午寫篇文章可能用掉 1 萬 Token,但一個跑著 agent 集群的工程師,一天能在後臺燒掉幾百萬 Token,一個字都不用打。
兩年前,每百萬 Token 的價格是 33 美元。現在,9 美分。跌了 99.7%。價格越便宜,燒得越猛。燒得越猛,越離不開。
閆俊傑在電話會上的預判是:未來市場對 Token 的需求,可能會增長一到兩個數量級。
這就是 2026 年給一家公司定價的新方式。不看你賺了多少錢,看你的 Token 被燒了多少。MiniMax 虧 2.5 億,但 Token 吞吐量的增長曲線陡得嚇人,資本市場願意下注。你可以把它類比成 2006 年的 YouTube,一毛錢收入沒有,但帶寬消耗量在指數增長,Google 願意花 16.5 億買它。
當年 YouTube 燒的是帶寬。今天 MiniMax 燒的是 Token。計量單位變了,邏輯沒變。
產能等得起,債務等不起
GTC 同一周還發生了一件事。
3 月 18 號,Stripe 發佈了 Machine Payments Protocol。說白了:AI agent 可以自己花錢了。
一個 agent 需要一組數據,自己付費下載。需要算力跑推理,自己按秒買。需要調用另一個 agent 的 API,自己結賬。整個過程不需要人類點確認。Visa 為這個協議適配了信用卡支付,Coinbase 做了 agent 專屬錢包,Mastercard 在開發 Agent Pay。
Token 的消耗從此多了一個來源。過去只有「人調度 agent」這一種場景。現在 agent 自己也在消耗 Token,而且在用 Token 賺來的錢去買更多 Token。Stripe 聯合創始人 John Collison 用了一個詞:洪流。
黃仁勳在臺上給了對應的數字:NVIDIA 要把 Token 生成速率從 2200 萬拉到 7 億,350 倍。
這是在建一整張公路網,賭車流量會指數增長。
6000 億美元的基建賭注,需要一個前提:全世界對 Token 的消耗量,要大到能撐起回本。這個前提目前還只是一個假設,而且是一個非常昂貴的假設。
2025 年最後一個季度,科技公司發行了創紀錄的 1087 億美元債券。進入 2026 年,頭幾周又是 1000 億。Morgan Stanley 和 JPMorgan 預估未來幾年 AI 相關企業借債總量可能達到 1.5 萬億美元。據 Goldman Sachs 估算,AI 資本開支已經佔到美國 GDP 的 3% 左右。
華爾街最先嗅到風險的一批人已經開始買保險了。信用違約互換的交易量在升。花幾十個基點的保費,賭的是這些公司可能還不上錢。Citi 的信用策略主管 Daniel Sorid 在一次投資人會議上說了一句:「作為信用投資者,面對這種規模的轉型,需要這麼大的資本投入,讓人本能地感到不安。」
Google 創始人 Larry Page 在公司內部說過一句更極端的話,Page 多次對 Google 員工說:「我寧願破產也不願輸掉這場競賽。」
它精確地描述了一個囚徒困境:每一家巨頭都在賭對手會繼續投入,所以自己不能停。停下來的人直接出局。
樂觀的一面有硬數據。Token 生成速率拉高 350 倍。Stripe 剛讓 agent 自己花錢。McKinsey 兩年內從幾千個 agent 擴到 2.5 萬個。如果 agent 經濟全面起飛,Token 消耗的增長曲線確實可能拐成指數級。
但有一個日期讓很多人睡不好覺。2026 年下半年,續約懸崖。
2024 到 2025 年,企業花的是「創新預算」。CEO 需要在財報會上說一句「我們在擁抱 AI」,價格不太敏感,效果不太苛求,花的是姿態的錢。2026 年下半年,第一批試點項目到續約節點。創新預算花完了,CTO 讓出了桌子對面的位置,CFO 坐了過來。CFO 只認一個數字:ROI。
如果大量試點被砍,Token 的終端消耗會突然出現缺口。上游 6000 億砸出來的產能,數據中心建好了,電力接通了,芯片上架了,變成閒置產能。
這種事歷史上發生過。
2000 年,電信公司花萬億美元鋪海底光纜。泡沫破裂,全球 90% 的光纜暗在海底,閒了將近十年。直到 Netflix 開始流媒體、iPhone 引爆移動互聯網,光纜才被一根一根點亮。光纜沒白鋪。鋪光纜的朗訊、北電、世通都破產了。基礎設施還在,建設者不在了。
2012 年,中國光伏。無錫尚德、江西賽維把組件價格打穿全球成本線。產能嚴重過剩,行業血洗三年。需求後來確實來了,光伏今天是地球上增長最快的能源。尚德破產了。賽維破產了。先行者躺在了黎明前最後一段黑暗裡。
貝爾發明電話後,Western Union 拒絕以 10 萬美元買下專利。十年後 Western Union 願意出 2500 萬美元,貝爾不賣了。三十年後電話網絡覆蓋了全美國。但鋪網絡的那些小公司,大多沒活到電話普及的那一天。贏家是後來靠收購和壟斷吃下一切的 AT&T。
基礎設施的故事永遠是這個版本。方向幾乎總是對的,但時間差會殺人。
回到 Token。前面講的那個結構,Token 變成真正幹活的勞動力,人就變成了接在 Token 上面的接口。好的接口能讓 Token 發揮更大價值,判斷力、審美、經驗,這些東西還在。但一個接口能做多少事,首先取決於它被接入了多少 Token。
1870 年代的美國農民發現,種出好小麥還不夠,得在鐵路邊上。1950 年代的手工匠人發現,手藝再好也拼不過流水線上的工人。2026 年的工程師正在發現,代碼寫得再漂亮,沒有 Token 預算,一切都是空轉。
當 Token 變成真正幹活的勞動力,人就變成了接口。接口本身的好壞還重要,但接口值多少錢,首先取決於誰在給它供電。
你靠著哪條鐵路
2023 年有卡就是爹。2026 年有 Token 就是爹。
聽起來像換了個詞,底下的變化比大多數人意識到的要深。
GPU 是資產,買到了就是你的,鎖在機房裡,別人拿不走。
Token 是流量。你的 10 倍產出、你的高估值、你在談判桌上的籌碼,全部建立在一股持續的、不屬於你的供給上。水龍頭一關,一切歸零。
當 Token 變成真正幹活的勞動力,人就變成了接口。好的接口能讓 Token 發揮更大價值,判斷力、審美、經驗,這些東西還在。但一個接口能做多少事,首先取決於它被接入了多少 Token。
1870 年代的美國農民發現,種出好小麥還不夠,得在鐵路邊上。1950 年代的手工匠人發現,手藝再好也拼不過流水線上的工人。2026 年的工程師正在發現,代碼寫得再漂亮,沒有 Token 預算,一切都是空轉。
當 Token 變成真正幹活的勞動力,人就變成了接口。接口本身的好壞還重要,但接口值多少錢,首先取決於誰在給它供電。
