梁文鋒的擔子更重了
DeepSeek-V4發佈,技術突破回應質疑
DeepSeek-V4正式上線,引發廣泛關注。梁文鋒藉此回應外界對DeepSeek迭代緩慢的質疑。V4版本參數規模達1.6T,支持100萬token的超長上下文,實現國產算力適配,並在昇騰平臺完成推理加速,展現技術實力。
面臨商業化與人才挑戰
儘管技術取得進展,DeepSeek仍面臨Coding、To B商業化路徑探索以及核心人才流失等挑戰。多位關鍵成員離職,引發市場對其長期發展穩定性的擔憂。
尋求外部融資,估值達100億美元
據外媒The Information報道,DeepSeek正尋求至少3億美元(約20億人民幣)的首輪外部融資,估值至少達100億美元。此舉被視為公司從技術自研向商業化擴張的重要轉折點。
創始人背景與戰略定位
梁文鋒是幻方量化創始人,其背景源自量化基金,具備深厚的AI與數據建模經驗。2023年7月,他創辦DeepSeek,正式進軍通用人工智能領域,強調「不搞應用產品,只專注研究與方向探索」。
技術路線與論文佈局
在V4發佈前,DeepSeek連發三篇由梁文鋒署名的學術論文,透露了下一代模型的技術方向,顯示其在技術路線上的前瞻性佈局。
