出圈一週年，DeepSeek的變與不變

DeepSeek的技術進展與成本優勢

根據報導，DeepSeek R1僅用兩個月就完成了訓練，成本僅為OpenAI等美國公司所花費金額的一小部分，但其效果與OpenAI的ChatGPT及Meta的Llama大模型不相上下。

專家學者指出，2025年一年時間，中國縮小了與美國在人工智慧領域的差距，將一歲的DeepSeek與三歲的ChatGPT作為「時代切片」，清晰看到陸美站在不同航道。

DeepSeek的研究對字節跳動「超連接」技術的短板進行了系統性補位，為大模型底層架構的工業化落地提供了新方案，進一步印證了硬件限制可轉化為創新動力。

DeepSeek並未在應用層的紅海中戀戰，而是退回到最枯燥、最硬核的角落，致力於夯實Transformer這座大廈的地基。其Engram技術解決了「記不住」的問題，強化了模型的長期記憶能力。

儘管DeepSeek在大模型領域持續發展，但其母公司去年進帳50億，足以支撐2380個R1模型的運營，顯示其商業潛力與規模。

資訊爆料顯示，DeepSeek計劃在2026年2月正式發佈下一代V4模型，其編程實力有望趕上Claude、GPT系列等頂尖閉源模型。