中國晶片,DeepSeek 與 Kimi 的隱秘交點

中國晶片,DeepSeek 與 Kimi 的隱秘交點

中國 AI 模型與國產晶片共進退

隨著中國大模型競爭加劇,DeepSeek 與 Kimi 等開源模型開始在技術路線與硬體基礎設施上展現出高度的一致性。這種「隱秘交點」不僅體現在模型架構的創新上,更關鍵地反映在對國產晶片生態的重構與依賴上。

Kimi 的技術突破與長上下文優化

Kimi 團隊在技術上做出了顯著貢獻,包括向開源社區提供二階優化器 MuonClip,以及提升大模型處理長上下文效率的 Kimi Linear 架構。最新推出的 Kimi K2.6 版本進一步強化了這些能力,支持 13 小時連續編碼及 4000 行代碼修改,顯著提升了智能體(Agent)集群的效率。

DeepSeek 與國產算力的深度整合

DeepSeek 則展現了與國產晶片廠商的深度合作。據技術文檔顯示,Kimi 團隊在 K2.6 版本中首次實現了「異構算力無縫調度」,利用國產晶片完成模型預填充。此外,DeepSeek 為華為昇騰平臺重寫了 200 多個核心算子,確保模型能在國產硬體上高效運行。

技術路線的共識與未來展望

在長文本處理方面,Kimi 探索線性注意力(Kimi Linear),而 DeepSeek 則探索稀疏注意力(DSA),兩者殊途同歸,顯示出中國 AI 社區對同一技術方向的必然選擇。這種共識不僅推動了開源模型的發展,也促使中國 AI 的底座與晶片產業同步動向,共同構建更具自主性的技術生態。

來源:https://36kr.com/p/3777442862256642

返回頂端