DeepSeek V4多模态识图功能上线:图像推理能力补齐关键短板

**时间:** 2026年4月29日-30日

**地点:** 中国

**事件:** DeepSeek正式启动识图模式灰度测试,在网页端与移动端同步上线。该模式与快速模式、专家模式并列,用户可通过上传图片触发模型对图像内容的理解、描述与分析。

**背景:** DeepSeek V4系列于4月24日发布,但初期版本仅支持纯文本处理,引发外界对多模态能力的期待。此次识图模式的上线,标志着DeepSeek在多模态技术路径上完成了关键布局。该模式采用"基于视觉原语的思考"新框架,将点、边界框等空间标记升格为推理基本单元。

**影响:** 识图模式具备图像推理能力,能识别图片背后的隐喻而非简单描述画面内容,同时具备联想、自纠错等思考过程。在测试中,能根据文物视觉特征准确推导其艺术风格与历史背景。这意味着DeepSeek成功补上了此前缺失的多模态能力短板,新一代旗舰模型的技术版图已趋于完整。

**总结:** DeepSeek多模态功能的上线,使其成为继GPT-5.4、Claude Opus 4.7之后又一家具备完整视觉理解能力的顶级大模型,国产大模型在多模态领域的竞争力进一步提升。

**参考来源:**
1. https://www.donews.com/news/detail/8/6539122.html
2. http://www.iheima.com/article-396902.html
3. https://new.qq.com/rain/a/20260429A085FA00
4. http://finance.sina.com.cn/jjxw/2026-04-30/doc-inhwhraf1263348.shtml
5. http://tech.caijing.com.cn/20260430/5157310.shtml
6. https://m.zol.com.cn/article/11731941.html

热门AI工具推荐

AI编程订阅服务,支持多款国产主流编程模型自由切换。
Seedance 2.0AI视频生成
具备卓越的物理真实性和角色一致性,可生成电影级视频内容。
SpeedAIAI内容检测降重
AI内容检测与降重工具,能有效帮助用户通过论文AI率检测
MonkeyCodeAI编程平台
企业级AI编程平台,支持私有化部署和自然语言编程以及MiniMax-M2.7免费无限量使用
秒哒AI工具
不懂代码也能开发应用?百度秒哒:无需编程,快速搭建小程序与网站
有戏AIAI漫剧生成工具
全流程AI短剧创作工具,实现从剧本到成片的自动化生产,让“一人即剧组”成为现实。
沁言学术智能科研平台
一站式文献管理与科研写作工具,支持边写作边搜索文献,高效阅读,文献管理,