DeepSeek發佈OCR2，能夠以人類相同邏輯順序識圖

核心創新與技術原理

DeepSeek發佈全新DeepSeek-OCR 2模型，採用創新的DeepEncoder V2方法，讓AI能夠根據圖像的含義動態重排圖像的各個部分，而不再只是機械地從左到右掃描。這種方式模擬了人類在觀看場景時所遵循的邏輯流程。

該模型在處理佈局複雜的圖片時，表現優於傳統的視覺-語言模型，實現了更智能、更具因果推理能力的視覺理解。其動態重排機制實質上將因果推理引入視覺理解層，對加密領域如鏈上圖像驗證等場景尤為重要。