DeepSeek更新「前夜」,有些問題得提前理一理

DeepSeek更新「前夜」,有些問題得提前理一理

DeepSeek的技術演進與產業影響

DeepSeek不再回答「中國能不能做出世界級模型」這樣的宏觀問題,而是聚焦於兩個更具體的問題:「中國AI能不能在算力封鎖下持續進化」,以及「大模型能不能變成能賺錢的企業級產品」。這顯示其技術路線從理論探索轉向實際商業應用。

成本與效能的優化

根據DeepSeek發布的數據,其推理階段激活的專家數遠少於總專家數,平均推理能耗比主流開源大模型下降約30%至50%。這種低成本、高性能的特性,使更多企業得以負擔並應用大模型技術,推動產業落地。

智能體應用的挑戰

「小龍蝦」類智能體應用的瘋狂「燒Token」,導致用戶使用成本大幅上升。在這種情況下,推動全行業降本增效的責任,已落於DeepSeek肩上,未來可能透過技術優化與生態調整來解決。

中美AI競爭的視角

有分析指出,DeepSeek代表的是中國模式的優越性,還是僅僅是一個特例?中美之間的AI技術差距是否正在縮小?這類問題引發對中國AI發展路徑與全球競爭格局的深入思考。

來源與背景

DeepSeek全稱「杭州深度求索人工智能基礎技術研究有限公司」,由幻方量化於2023年7月17日創立,位於杭州市拱墅區,是一家專注於大模型技術的創新科技企業。

來源:https://36kr.com/p/3760900027892481

返回頂端