时间:2026年7月3日
地点:中国北京,2026全球数字经济大会
人物:生数科技创始人朱军教授、Vidu S1研发负责人张金涛(00后博士生)、生数科技团队
事件详情:2026年7月3日,在2026全球数字经济大会人工智能融合应用发展论坛上,生数科技创始人朱军正式发布面向实时交互场景的新一代模型——Vidu S1实时交互模型。该模型由朱军教授的00后博士生张金涛担任项目负责人,带领团队完成全链路研发。Vidu S1支持实时视频通话和语音控制视频走向,用户可通过语音控制数字人行为,实现无限时长连续互动。模型支持540P(960x540)高清分辨率、25FPS帧率(最高支持42FPS),可基于真人、动漫、萌宠等任意初始形象及个性化音色,快速创建专属交互角色。采用自回归扩散模型(AR+Diffusion)路线,基于已生成历史画面结合语音指令和对话上下文,持续预测并生成后续内容。该模型可在消费级显卡上运行。
背景:Vidu S1是生数科技通用世界模型整体布局在实时交互式生成方面的重要突破。生数科技是由清华大学朱军教授领衔的AI视频生成领军企业,此前推出的Vidu系列模型是国内首个长时长、高一致性、高动态性视频大模型。Vidu S1的发布标志着视频生成从离线成片迈向可对话、可响应、可持续在线的实时交互新时代,将视频生成技术推向全新维度。
影响:
- Vidu S1改变了视频模型只能生成预设内容的固有模式,首次实现了实时互动视频生成,将推动虚拟数字人、在线教育、直播带货等行业的交互体验升级
- 能够跑在消费级显卡上意味着技术门槛大幅降低,中小企业和个人开发者也能利用该技术打造专属交互角色,加速AI应用普及
- 00后博士生带队完成全链路研发,展现出中国AI人才梯队年轻化趋势,年轻一代科研力量正在AI前沿领域崭露头角
总结:Vidu S1实时交互模型的发布是AI视频生成领域从离线到实时的重要转折点,让视频从预先确定的内容转变为持续生成、实时响应、动态演化的交互过程。这一技术突破不仅展示了中国AI公司在视频生成领域的创新能力,也为AI数字人、虚拟社交、在线教育等交互场景开辟了全新可能性。
参考来源:
- https://new.qq.com/rain/a/20260703A0BUFU00
- https://new.qq.com/rain/a/20260703A0CJGI00
- https://so.html5.qq.com/page/real/search_news?docid=70000021_6646a47a24224052
- https://www.jiqizhixin.com/
- https://next.ithome.com/ai
- https://www.vidu.cn/vidu-stream









