DeepSeek大量招人,該梁文鋒上場了

DeepSeek大量招人,該梁文鋒上場了

團隊擴張與行政招聘

早在2025年11月,DeepSeek便開放行政招聘,據相關人士表述,「是因為團隊大了,需要更多的行政夥伴」。

梁文鋒領導新論文發表

新年伊始,DeepSeek由CEO梁文鋒親自掛帥,發布新論文《Manifold-Constrained Hyper-Connections》,直指AI用了10年的「承重牆」。

技術創新與模型進化

梁文鋒參與合著的一篇論文透露,DeepSeek改進了傳統MoE模型的訓練方法,採用「細粒度專家+通才專家」的架構,提升模型效能與穩定性。

模型效能與成本優勢

DeepSeek-V3模型的效能不僅足以對標OpenAI最先進模型GPT-4o,訓練成本更僅約557.6萬美元,用時僅約20天,顯示其技術與成本優勢。

背景與創辦資訊

2023年5月,38歲的梁文鋒宣佈進軍通用人工智能(AGI),同年7月創辦杭州深度求索人工智能基礎技術研究有限公司,即DeepSeek公司。

梁文鋒亦被報導曾大量囤積輝達顯卡,以支持其AI模型訓練需求。

來源:https://36kr.com/p/3639155793588998

返回頂端