出圈一週年,DeepSeek的變與不變

出圈一週年,DeepSeek的變與不變

DeepSeek的技術進展與成本優勢

根據報導,DeepSeek R1僅用兩個月就完成了訓練,成本僅為OpenAI等美國公司所花費金額的一小部分,但其效果與OpenAI的ChatGPT及Meta的Llama大模型不相上下。

中美AI發展路徑對比

專家學者指出,2025年一年時間,中國縮小了與美國在人工智慧領域的差距,將一歲的DeepSeek與三歲的ChatGPT作為「時代切片」,清晰看到陸美站在不同航道。

DeepSeek的技術定位與產業影響

DeepSeek的研究對字節跳動「超連接」技術的短板進行了系統性補位,為大模型底層架構的工業化落地提供了新方案,進一步印證了硬件限制可轉化為創新動力。

DeepSeek的發展策略與未來規劃

DeepSeek並未在應用層的紅海中戀戰,而是退回到最枯燥、最硬核的角落,致力於夯實Transformer這座大廈的地基。其Engram技術解決了「記不住」的問題,強化了模型的長期記憶能力。

商業與財務表現

儘管DeepSeek在大模型領域持續發展,但其母公司去年進帳50億,足以支撐2380個R1模型的運營,顯示其商業潛力與規模。

下一代模型發布計畫

資訊爆料顯示,DeepSeek計劃在2026年2月正式發佈下一代V4模型,其編程實力有望趕上Claude、GPT系列等頂尖閉源模型。

來源:https://36kr.com/p/3640540824161417

返回頂端