2026-05-30 12:54

谷歌Veo 3 AI视频生成模型支持画音同步生成

时间：2025年5月

地点：美国加州山景城

人物：谷歌DeepMind

事件详情：谷歌DeepMind在I/O开发者大会上发布第三代视频生成模型Veo 3，该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣或街头交通等场景配上相应的音效，实现更逼真的视听体验。

背景：Veo 3对标OpenAI的Sora，首次实现了视频与同步音频的生成能力，包括背景音效、人物对话和环境噪音。该模型已集成到谷歌的AI影视制作工具Flow中，目前主要面向美国地区的Gemini Ultra订阅用户，每月收费249.99美元。

影响：
- AI视频生成技术实现画音同步的重大突破
- 影视创作和内容生产效率大幅提升
- 推动AI在创意产业的应用深化

总结：谷歌Veo 3的发布标志着AI视频生成技术的重要里程碑。通过实现视频与音频的同步生成，Veo 3为影视创作者和内容生产者提供了更强大的工具，有望改变传统视频制作的流程和方式。

参考来源：
https://www.163.com/dy/article/K03D9DR60526D8LR.html
https://new.qq.com/rain/a/20250622A04AMO00

热门AI工具推荐