热门AI工具推荐

AI编程订阅服务,支持多款国产主流编程模型自由切换。
Seedance 2.0AI视频生成
具备卓越的物理真实性和角色一致性,可生成电影级视频内容。
方舟 Agent PlanAI智能体订阅
火山引擎推出的全场景AI智能体订阅服务,通过一个订阅整合5大主流模型和10+AI工具
基于OpenClaw架构打造的AI助手平台,核心优势包括云端一键部署、沙箱隔离安全运行、全面接入企业微信/钉钉/飞书三大主流IM工具
SpeedAIAI内容检测降重
AI内容检测与降重工具,能有效帮助用户通过论文AI率检测
墨刀AIAI原型设计平台
墨刀AI是一款能通过一句话描述或图片,快速生成可交互原型、PRD文档及各类图表的一站式智能产品设计协作平台。
秒哒AI工具
不懂代码也能开发应用?百度秒哒:无需编程,快速搭建小程序与网站
有戏AIAI漫剧生成工具
全流程AI短剧创作工具,实现从剧本到成片的自动化生产,让“一人即剧组”成为现实。
沁言学术智能科研平台
一站式文献管理与科研写作工具,支持边写作边搜索文献,高效阅读,文献管理,

谷歌发布Gemini Omni多模态模型,视频生成迎来关键突破

时间:2026年5月20日

地点:美国加州山景城

人物:谷歌、DeepMind、Demis Hassabis

事件详情:诺贝尔物理学奖获得者、Google DeepMind负责人哈萨比斯在本届I/O大会正式发布Gemini Omni,这是Gemini模型家族迄今为止能力最为全面的版本。Omni顾名思义,意指全能,该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。

背景:Gemini Omni是一款基于谷歌在世界模型方面积累的新型视频生成模型。按照谷歌的介绍,Gemini Omni可以基于多种输入生成视频,并支持对话式编辑。用户可以通过自然语言修改角色、背景和场景,也可以上传自拍并将其转换成其他风格或内容。

影响:
- 未来Omni将能够根据任何输入生成任何输出
- 首款模型Gemini Omni Flash将于今年夏季推出
- Gemini 3.5 Flash生成输出Token的速度大约是其他前沿模型的4倍
- 谷歌扩展了SynthID验证功能,用户可以询问一张图片是否由AI生成
- SynthID目前已经为10亿张图片和视频以及6万年的音频添加了水印

总结:Gemini Omni的发布标志着多模态AI进入新阶段,视频生成能力实现关键突破,AI生成内容识别能力同步增强。

参考来源:
- https://www.nbd.com.cn/articles/2026-05-20/4400121.html
- https://k.sina.com.cn/article_7857201856_1d45362c001905o958.html
- https://k.sina.com.cn/article_7857201856_1d45362c001905o2fw.html