2025：大語言模型（LLM）之年

技術突破與行業格局重塑

站在2025年的開端回望，過去一年的大語言模型（LLM）領域堪稱“範式迭代之年”——技術突破目不暇接，行業格局持續重塑，全新交互形態不斷湧現。

自GPT架構誕生以來，大語言模型領域已走過七年曆程。從2019年的GPT-2到2024-2025年間的DeepSeek-V3、Qwen3、Llama4等，我們驚訝地發現，這些先進模型在宏觀層面展現出顯著進步。

基本上，每一個主要的開源權重或閉源大語言模型開發者在DeepSeek R1 之後，都發布了其模型的推理（通常稱為“思考”）版本，標誌著LLM在實際應用中的能力大幅提升。

2025年，基於可驗證獎勵的強化學習（RLVR）應運而生，順勢成為訓練量產級大語言模型流程中新增的核心環節，顯著提升了模型的推理與決策能力。

除了模型能力本身的進展，LLM應用層也逐漸成熟，軟件正在重新分工。Andrej Karpathy特別指出，2025年另一個容易被低估、卻同樣關鍵的變化，來自LLM應用層的成熟，推動了產業生態的進一步發展。

回望2025年，大語言模型行業取得了一些發展，但同時也面臨著一定的挑戰。DeepSeek憑藉開源策略和推理功能成為黑馬，用戶增長很快，顯示出市場對高效、可訪問模型的強烈需求。