时间:2026年4月28日
地点:美国
人物:英伟达(NVIDIA)
事件详情:当地时间4月28日,英伟达正式发布开源全模态推理模型Nemotron 3 Nano Omni,旨在为企业级AI Agent打造一体化基础模型平台。该模型以"原生全模态理解+高效推理"为核心卖点,整合视觉、音频及语言能力,可使AI智能体的效率提升幅度达到9倍。模型基于30B-A3B混合专家架构,将视觉与音频编码器集成于单一系统之中,无需单独的感知模型,在复杂文档智能解析、视频及音频理解等六大权威排行榜上位居榜首。
背景:大模型竞争正在从文本生成能力转向智能体(Agent)和应用效率。与过去围绕单一模态展开的技术竞赛不同,Nemotron 3 Nano Omni将文本、图像、音频与视频统一到一个推理体系之中,并通过更高效的架构设计降低算力消耗。英伟达表示,该模型在代理系统中可与专有云模型、Nemotron开放模型及第三方模型协同工作。
影响:
- 富士康、甲骨文、Palantir等企业已率先采用该模型,H Company利用该模型实现全高清屏幕录像的实时解读,这在以前是无法实现的
- 英伟达Nemotron系列模型过去一年下载量已超过5000万次,新款Omni模型进一步巩固英伟达在AI基础设施领域的领导地位
总结:英伟达发布的Nemotron 3 Nano Omni是业内领先的开源全模态推理模型,其核心创新在于将多模态能力整合进单一模型,实现从感知、理解到推理的统一闭环。该模型采用30B-A3B混合专家架构,推理吞吐量是其他具有相同交互性的开放式全模态模型的9倍,在显著降低成本的同时不牺牲响应速度或质量。英伟达同时开源了模型权重、训练配方及数据集,并将作为NVIDIA NIM微服务上线,为企业部署AI智能体提供更低门槛的选择。
参考来源:
https://www.sohu.com/a/1015987725_121400326
https://www.donews.com/news/detail/8/6534834.html
https://www.toutiao.com/article/7634325525833499151/
https://m.mydrivers.com/newsview/1119212.html
https://finance.sina.com.cn/tech/roll/2026-04-29/doc-inhwcqxn6826308.shtml
https://so.html5.qq.com/page/real/search_news?docid=70000021_05969f17a4494652






