英伟达发布Nemotron 3 Nano Omni:开源全模态模型,AI智能体效率提升9倍

时间:2026年4月28日

地点:美国

人物:英伟达(NVIDIA)

事件详情:当地时间4月28日,英伟达正式发布开源全模态推理模型Nemotron 3 Nano Omni,旨在为企业级AI Agent打造一体化基础模型平台。该模型以"原生全模态理解+高效推理"为核心卖点,整合视觉、音频及语言能力,可使AI智能体的效率提升幅度达到9倍。模型基于30B-A3B混合专家架构,将视觉与音频编码器集成于单一系统之中,无需单独的感知模型,在复杂文档智能解析、视频及音频理解等六大权威排行榜上位居榜首。

背景:大模型竞争正在从文本生成能力转向智能体(Agent)和应用效率。与过去围绕单一模态展开的技术竞赛不同,Nemotron 3 Nano Omni将文本、图像、音频与视频统一到一个推理体系之中,并通过更高效的架构设计降低算力消耗。英伟达表示,该模型在代理系统中可与专有云模型、Nemotron开放模型及第三方模型协同工作。

影响:
- 富士康、甲骨文、Palantir等企业已率先采用该模型,H Company利用该模型实现全高清屏幕录像的实时解读,这在以前是无法实现的
- 英伟达Nemotron系列模型过去一年下载量已超过5000万次,新款Omni模型进一步巩固英伟达在AI基础设施领域的领导地位

总结:英伟达发布的Nemotron 3 Nano Omni是业内领先的开源全模态推理模型,其核心创新在于将多模态能力整合进单一模型,实现从感知、理解到推理的统一闭环。该模型采用30B-A3B混合专家架构,推理吞吐量是其他具有相同交互性的开放式全模态模型的9倍,在显著降低成本的同时不牺牲响应速度或质量。英伟达同时开源了模型权重、训练配方及数据集,并将作为NVIDIA NIM微服务上线,为企业部署AI智能体提供更低门槛的选择。

参考来源:
https://www.sohu.com/a/1015987725_121400326
https://www.donews.com/news/detail/8/6534834.html
https://www.toutiao.com/article/7634325525833499151/
https://m.mydrivers.com/newsview/1119212.html
https://finance.sina.com.cn/tech/roll/2026-04-29/doc-inhwcqxn6826308.shtml
https://so.html5.qq.com/page/real/search_news?docid=70000021_05969f17a4494652

热门AI工具推荐

AI编程订阅服务,支持多款国产主流编程模型自由切换。
Seedance 2.0AI视频生成
具备卓越的物理真实性和角色一致性,可生成电影级视频内容。
SpeedAIAI内容检测降重
AI内容检测与降重工具,能有效帮助用户通过论文AI率检测
MonkeyCodeAI编程平台
企业级AI编程平台,支持私有化部署和自然语言编程以及MiniMax-M2.7免费无限量使用
秒哒AI工具
不懂代码也能开发应用?百度秒哒:无需编程,快速搭建小程序与网站
有戏AIAI漫剧生成工具
全流程AI短剧创作工具,实现从剧本到成片的自动化生产,让“一人即剧组”成为现实。
沁言学术智能科研平台
一站式文献管理与科研写作工具,支持边写作边搜索文献,高效阅读,文献管理,