DeepSeek發佈下一代技術!北大實習生立功

DeepSeek發佈下一代技術!北大實習生立功

技術背景

DeepSeek發佈了一項名為DualPath的全新推理系統方案,直指當前大語言模型在智能體應用場景下遭遇的短板——KV緩存存儲I/O瓶頸。

核心技術亮點

該方案通過優化推理架構,基本消除了KV緩存的I/O開銷,顯著提升了大語言模型在智能體場景下的運行效率。

合作與研發團隊

這項技術由DeepSeek聯合北京大學、清華大學共同研發,其中北大實習生在項目中發揮了關鍵作用,被認定為「立功」。

相關論文與發佈信息

相關研究成果已發表於《DualPath:突破智能體LLM推理中的存儲帶寬瓶頸》論文中,該論文由DeepSeek團隊與清北計算機學院聯合撰寫。

延伸資訊

DeepSeek V4 Lite原生多模態AI也已曝光,具備百萬tokens上下文能力,非思考生圖性能超越前代產品。

來源:https://36kr.com/p/3701088020721285

返回頂端