2025:大語言模型(LLM)之年

2025:大語言模型(LLM)之年

技術突破與行業格局重塑

站在2025年的開端回望,過去一年的大語言模型(LLM)領域堪稱“範式迭代之年”——技術突破目不暇接,行業格局持續重塑,全新交互形態不斷湧現。

模型演進與推理能力提升

自GPT架構誕生以來,大語言模型領域已走過七年曆程。從2019年的GPT-2到2024-2025年間的DeepSeek-V3、Qwen3、Llama4等,我們驚訝地發現,這些先進模型在宏觀層面展現出顯著進步。

基本上,每一個主要的開源權重或閉源大語言模型開發者在DeepSeek R1 之後,都發布了其模型的推理(通常稱為“思考”)版本,標誌著LLM在實際應用中的能力大幅提升。

強化學習與架構演進

2025年,基於可驗證獎勵的強化學習(RLVR)應運而生,順勢成為訓練量產級大語言模型流程中新增的核心環節,顯著提升了模型的推理與決策能力。

應用層成熟與產業分工

除了模型能力本身的進展,LLM應用層也逐漸成熟,軟件正在重新分工。Andrej Karpathy特別指出,2025年另一個容易被低估、卻同樣關鍵的變化,來自LLM應用層的成熟,推動了產業生態的進一步發展。

市場表現與挑戰

回望2025年,大語言模型行業取得了一些發展,但同時也面臨著一定的挑戰。DeepSeek憑藉開源策略和推理功能成為黑馬,用戶增長很快,顯示出市場對高效、可訪問模型的強烈需求。

來源:https://36kr.com/p/3640423298125193

返回頂端