「思考用時100秒」成歷史？AI推理太耗時，伯克利要讓模型並行推理

主流AI推理模式現狀

目前主流模型普遍採用的「順序推理」模式：大模型接到複雜任務後，會先把任務分割成一個個邏輯相連的小任務，然後從頭到尾一步步推，之後再驗證結果。

針對「轉圈圈」現象，伯克利人工智能研究實驗室（BAIR）提出自適應並行推理（Adaptive Parallel Reasoning）解決方案，讓AI學會自主決定何時串行思考、何時並行處理任務。

該方法透過訓練AI掌握類似項目經理的資源分配能力，讓模型能根據任務性質動態調整推理策略，提升效率與準確性。

研究人員提出「NoThinking」方法，讓模型不需要花時間構建與輸出思考過程，從而減少生成的token數量，提高推理速度。

在低資源情境下，NoThinking表現優於傳統Thinking方法，顯示未來AI推理可能朝向更高效、更簡潔的方向發展。