时间:2026年4月29日
地点:美国加州圣克拉拉
人物:英伟达
事件详情:英伟达正式发布开源全模态推理模型Nemotron 3 Nano Omni,融合视觉、音频与语言能力于单一模型,专为企业级AI Agent打造一体化基础模型底座。该模型可将AI智能体效率提升9倍,4月28日起在多个平台上线,富士康、甲骨文、帕兰蒂尔等企业已率先采用。
背景:2026年AI产业竞争焦点正从模型能力转向智能体(Agent)和应用效率。英伟达此次发布的新模型采用30B-A3B混合专家(MoE)架构,将视觉与音频编码器集成于其中,无需单独的感知模型。该模型在复杂文档智能、视频和音频理解等六大权威排行榜上均位居榜首。相比此前多模型拼接的繁琐部署模式,大幅降低企业落地门槛与算力消耗。
影响:
- AI智能体效率提升9倍,企业级AI应用成本将显著下降
- 多模态统一模型成行业新方向,谷歌、OpenAI等将面临更大竞争压力
- 富士康、甲骨文、帕兰蒂尔等企业率先采用,企业AI落地进程加速
- 消费级机器人产品智能化水平有望进一步提升,2026年或成物理AI爆发元年
总结:英伟达正式发布Nemotron 3 Nano Omni开源全模态推理模型,整合视觉、语音、文本多维能力,使AI智能体效率提升9倍。该模型以"原生全模态理解+高效推理"为核心卖点,为开放式多模态模型树立新的效率标杆。目前已在MMlongbench-Doc、OCRBenchV2、WorldSense、DailyOmni、VoiceBench等六大排行榜上名列榜首,富士康、甲骨文、帕兰蒂尔等企业已率先采用。
参考来源:
https://finance.sina.com.cn/wm/2026-04-29/doc-inhwattw7090519.shtml
https://finance.eastmoney.com/a/202604303725550314.html
http://k.sina.com.cn/article_5953189932_162d6782c067046yvg.html
https://www.sohu.com/a/1016212067_121885030
https://www.toutiao.com/article/7634325525833499151/









