**时间:** 2026年4月29日-30日
**地点:** 中国
**事件:** DeepSeek正式启动识图模式灰度测试,在网页端与移动端同步上线。该模式与快速模式、专家模式并列,用户可通过上传图片触发模型对图像内容的理解、描述与分析。
**背景:** DeepSeek V4系列于4月24日发布,但初期版本仅支持纯文本处理,引发外界对多模态能力的期待。此次识图模式的上线,标志着DeepSeek在多模态技术路径上完成了关键布局。该模式采用"基于视觉原语的思考"新框架,将点、边界框等空间标记升格为推理基本单元。
**影响:** 识图模式具备图像推理能力,能识别图片背后的隐喻而非简单描述画面内容,同时具备联想、自纠错等思考过程。在测试中,能根据文物视觉特征准确推导其艺术风格与历史背景。这意味着DeepSeek成功补上了此前缺失的多模态能力短板,新一代旗舰模型的技术版图已趋于完整。
**总结:** DeepSeek多模态功能的上线,使其成为继GPT-5.4、Claude Opus 4.7之后又一家具备完整视觉理解能力的顶级大模型,国产大模型在多模态领域的竞争力进一步提升。
**参考来源:**
1. https://www.donews.com/news/detail/8/6539122.html
2. http://www.iheima.com/article-396902.html
3. https://new.qq.com/rain/a/20260429A085FA00
4. http://finance.sina.com.cn/jjxw/2026-04-30/doc-inhwhraf1263348.shtml
5. http://tech.caijing.com.cn/20260430/5157310.shtml
6. https://m.zol.com.cn/article/11731941.html






