时间:2025年5月
地点:美国加州山景城
人物:谷歌DeepMind
事件详情:谷歌DeepMind在I/O开发者大会上发布第三代视频生成模型Veo 3,该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣或街头交通等场景配上相应的音效,实现更逼真的视听体验。
背景:Veo 3对标OpenAI的Sora,首次实现了视频与同步音频的生成能力,包括背景音效、人物对话和环境噪音。该模型已集成到谷歌的AI影视制作工具Flow中,目前主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元。
影响:
- AI视频生成技术实现画音同步的重大突破
- 影视创作和内容生产效率大幅提升
- 推动AI在创意产业的应用深化
总结:谷歌Veo 3的发布标志着AI视频生成技术的重要里程碑。通过实现视频与音频的同步生成,Veo 3为影视创作者和内容生产者提供了更强大的工具,有望改变传统视频制作的流程和方式。
参考来源:
https://www.163.com/dy/article/K03D9DR60526D8LR.html
https://new.qq.com/rain/a/20250622A04AMO00









