2026-05-01 14:30

DeepSeek V4多模态识图功能上线：图像推理能力补齐关键短板

**时间：** 2026年4月29日-30日

**地点：** 中国

**事件：** DeepSeek正式启动识图模式灰度测试，在网页端与移动端同步上线。该模式与快速模式、专家模式并列，用户可通过上传图片触发模型对图像内容的理解、描述与分析。

**背景：** DeepSeek V4系列于4月24日发布，但初期版本仅支持纯文本处理，引发外界对多模态能力的期待。此次识图模式的上线，标志着DeepSeek在多模态技术路径上完成了关键布局。该模式采用"基于视觉原语的思考"新框架，将点、边界框等空间标记升格为推理基本单元。

**影响：** 识图模式具备图像推理能力，能识别图片背后的隐喻而非简单描述画面内容，同时具备联想、自纠错等思考过程。在测试中，能根据文物视觉特征准确推导其艺术风格与历史背景。这意味着DeepSeek成功补上了此前缺失的多模态能力短板，新一代旗舰模型的技术版图已趋于完整。

**总结：** DeepSeek多模态功能的上线，使其成为继GPT-5.4、Claude Opus 4.7之后又一家具备完整视觉理解能力的顶级大模型，国产大模型在多模态领域的竞争力进一步提升。

**参考来源：**
1. https://www.donews.com/news/detail/8/6539122.html
2. http://www.iheima.com/article-396902.html
3. https://new.qq.com/rain/a/20260429A085FA00
4. http://finance.sina.com.cn/jjxw/2026-04-30/doc-inhwhraf1263348.shtml
5. http://tech.caijing.com.cn/20260430/5157310.shtml
6. https://m.zol.com.cn/article/11731941.html

热门AI工具推荐