再等等梁文鋒

再等等梁文鋒

背景與成就

梁文鋒是DeepSeek的創辦人,於2023年12月創立公司,並在第二年發佈了首個AI大型語言模型。他出生於中國廣東湛江,自小展現數理天賦,初中時期即學完高中數學,並開始自學大學微積分。

DeepSeek技術突破

2025年春節前一週,梁文鋒帶領DeepSeek發布推理大模型R1,以極低的成本實現與世界頂級模型同臺競技的性能,被視為東方開源革命的代表。

例如,DeepSeek-V2(236B參數)在推理時僅激活21B參數,使配備AI SOC芯片的PC也能達到近20 TPS(每秒詞元數)甚至更高的速度,大幅降低運算成本。

產業影響與評價

DeepSeek的出現被視為AI大模型領域的突破,以超低成本提供頂尖模型性能,成功征服全球科技圈,引發廣泛關注與討論。

外界對梁文鋒的個人背景知之甚少,但其在量化投資與AI領域的結合,被視為一種創新與未來展望。

來源:https://m.36kr.com/p/3774802407654147

返回頂端