2026-04-30 09:21

英伟达发布Nemotron 3 Nano Omni：开源全模态模型，AI智能体效率提升9倍

时间：2026年4月28日

地点：美国

人物：英伟达（NVIDIA）

事件详情：当地时间4月28日，英伟达正式发布开源全模态推理模型Nemotron 3 Nano Omni，旨在为企业级AI Agent打造一体化基础模型平台。该模型以"原生全模态理解+高效推理"为核心卖点，整合视觉、音频及语言能力，可使AI智能体的效率提升幅度达到9倍。模型基于30B-A3B混合专家架构，将视觉与音频编码器集成于单一系统之中，无需单独的感知模型，在复杂文档智能解析、视频及音频理解等六大权威排行榜上位居榜首。

背景：大模型竞争正在从文本生成能力转向智能体（Agent）和应用效率。与过去围绕单一模态展开的技术竞赛不同，Nemotron 3 Nano Omni将文本、图像、音频与视频统一到一个推理体系之中，并通过更高效的架构设计降低算力消耗。英伟达表示，该模型在代理系统中可与专有云模型、Nemotron开放模型及第三方模型协同工作。

影响：
- 富士康、甲骨文、Palantir等企业已率先采用该模型，H Company利用该模型实现全高清屏幕录像的实时解读，这在以前是无法实现的
- 英伟达Nemotron系列模型过去一年下载量已超过5000万次，新款Omni模型进一步巩固英伟达在AI基础设施领域的领导地位

总结：英伟达发布的Nemotron 3 Nano Omni是业内领先的开源全模态推理模型，其核心创新在于将多模态能力整合进单一模型，实现从感知、理解到推理的统一闭环。该模型采用30B-A3B混合专家架构，推理吞吐量是其他具有相同交互性的开放式全模态模型的9倍，在显著降低成本的同时不牺牲响应速度或质量。英伟达同时开源了模型权重、训练配方及数据集，并将作为NVIDIA NIM微服务上线，为企业部署AI智能体提供更低门槛的选择。

参考来源：
https://www.sohu.com/a/1015987725_121400326
https://www.donews.com/news/detail/8/6534834.html
https://www.toutiao.com/article/7634325525833499151/
https://m.mydrivers.com/newsview/1119212.html
https://finance.sina.com.cn/tech/roll/2026-04-29/doc-inhwcqxn6826308.shtml
https://so.html5.qq.com/page/real/search_news?docid=70000021_05969f17a4494652

热门AI工具推荐