「Token」必須死？語言模型的「思考」不必逐字發生

語言模型的思考機制與Token的關係

近年來，大型語言模型（LLM）的底層運作機制受到廣泛關注。雖然傳統上語言模型透過「分詞」（Tokenization）將文本切分成最小單位（Token）來進行處理，但研究指出，語言模型的「思考」過程並非必須逐字、逐Token進行。

Token是連結人類語言與模型數學世界的橋樑，是模型處理文本的最小單位，但並非傳統意義上的「字」或「詞」。部分Token僅用於維持語句連貫性，並非真正參與推理過程，因此被稱為「水字數」。

研究顯示，大模型的推理品質與「思維鏈」（Chain-of-Thought, CoT）中Token數量無正相關。真正影響推理深度的，是那些具有複雜規劃與邏輯結構的關鍵Token，而非簡單的Token數量堆疊。

未來語言模型的發展將不再依賴「Token」數量的增加來提升推理能力，而是聚焦於如何提升關鍵Token的品質與結構，進而實現更高效、更真實的「思考」過程。