时间:2026年6月22日
地点:中国杭州
人物:阿里巴巴集团、阿里ATH创新事业群、HappyHorse研发团队
事件详情:6月22日,阿里巴巴正式发布视频生成模型HappyHorse 1.1版本。相较1.0版本,HappyHorse 1.1围绕五大核心维度进行了系统性升级:动态表现力——优化运动建模与时序一致性,大幅提升动作连贯性;主体一致性——支持最多9张角色参考图同时输入,增强多分镜理解与提示词遵循能力;指令遵循——模型对复杂文本指令的理解和执行准确率显著提升;视觉质感——"油光感""过度锐化"等AI常见画质问题得到明显缓解,保留痘印、法令纹、毛孔等真实细节;音频表达能力——台词表达更加自然,语速、停顿、语气能够根据场景与情绪变化动态调整。HappyHorse官网、阿里云百炼平台和千问云均已接入最新版本。该版本在技术规格上与1.0版本保持一致,单次生成时长3至15秒,支持720p和1080p分辨率及自由宽高比。
背景:HappyHorse是阿里巴巴ATH创新事业群研发的视频生成模型,采用150亿参数的单流Transformer统一框架,实现文本、图像、声音、影像的多模态协同建模。1.0版本于2026年4月27日开启灰度测试,一经推出即登顶全球AI视频盲测榜单。当前AI视频生成赛道竞争极为激烈,OpenAI的Sora、谷歌Veo、字节跳动的即创等国内外玩家纷纷加速迭代。阿里巴巴选择在短视频和短剧内容爆发的风口上持续加码AI视频工具,目前已覆盖短剧制作、电商广告、品牌营销、游戏CG等多个内容生产场景。
影响:
- HappyHorse 1.1的音频能力升级解决了AI视频长期存在的"声音与画面不匹配"痛点,台词表达的提升使其在短剧和品牌广告等专业场景中更具实用价值
- 9张角色参考图同时输入的能力大幅降低了视频创作门槛,创作者不需要繁复的后期调试即可生成风格统一的连续画面,有望加速AI视频在电商营销领域的规模化应用
- 视觉质感的显著改善——去除"油光感"保留真实皮肤细节——使AI生成的视频更接近专业影视水准,将推动专业内容生产团队加速采用AI视频工具
总结:阿里巴巴HappyHorse 1.1的发布标志着AI视频生成技术从"能生成"向"生成得更好、更可控、更具专业性"的跨越式进步。五大维度的系统升级回应了创作者在实际使用中的核心痛点,特别是音频与视觉质感的同步提升使得AI生成的视频更接近传统制片品质。在AI视频生成赛道日益拥挤的2026年,HappyHorse依靠音画同步生成和细节还原等技术优势保持了竞争力。随着该模型接入阿里云百炼和千问云,企业用户可以更低门槛获取专业的AI视频生产能力,AI视频创作正加速从专业工具走向普惠化。
参考来源:
- https://new.qq.com/rain/a/20260622A08GNJ00
- https://so.html5.qq.com/page/real/search_news?docid=70000021_8676a38e4e168352
- https://so.html5.qq.com/page/real/search_news?docid=70000021_6336a38e98690752
- https://so.html5.qq.com/page/real/search_news?docid=70000021_7176a3a000418665
- https://so.html5.qq.com/page/real/search_news?docid=70000021_5526a3a250a83652
- https://blog.csdn.net/TG_yilong_cloud/article/details/161395184









