DeepSeek識圖模式是個新模型?一手實測在此

DeepSeek識圖模式是個新模型?一手實測在此

識圖模式功能簡介

DeepSeek已上線「識圖模式」,並進入灰度測試階段,用戶可在官方App中通過輸入欄上方的「識圖模式」選項使用該功能,與「快速模式」和「專家模式」並列,標註為「圖片理解功能內測中」。

實測表現與使用體驗

在非思考模式下,DeepSeek視覺模型的速度非常快,甚至比「閃電五連鞭」還要迅速。實測顯示,模型能準確識別圖片內容,例如Windows文件資源管理器截圖中的文件信息,並輸出結構化JSON,展現出強大的圖像理解能力。

模型不僅描述畫面細節,還能識別圖片中的角色,並還原背景、打光等元素,表現超出預期。

技術背景與多模態進展

識圖模式是DeepSeek多模態能力的重要體現,標誌著其從純文本模型向多模態模型的演進。部分用戶已通過官方App體驗到該功能,儘管並非所有用戶都能被納入灰度測試。

有資料顯示,DeepSeek API已返回「識圖模式」字段,但部分用戶反饋仍處於不可用狀態,顯示接口側功能尚在完善中。

相關討論與評價

該功能引發廣泛討論,有觀點認為識圖模式可能是一個獨立於V4 Flash/Pro的新模型,凸顯DeepSeek在多模態領域的技術突破。

來源:https://m.36kr.com/p/3788953636510720

返回頂端