
一、寻光是什么?
寻光AI是阿里达摩院在2024年上海世界人工智能大会(WAIC)上发布的一站式AI视频创作平台,定位为PUGC(专业用户生成内容)工具。其核心理念是通过AI工作流重塑传统视频制作流程,将剧本创作、分镜设计、素材生成、图层编辑、一致性控制等环节整合到同一平台中,显著降低创作门槛。达摩院视觉技术实验室专家陈威华强调,寻光的目标是让“视频编辑像操作PPT一样简洁直观”,即使零基础用户也能快速生成高质量视频内容。

与OpenAI的Sora等单一视频生成模型不同,寻光侧重于解决AI视频生成的可控性、一致性与编辑效率问题。例如,Sora生成的《Air Head》短片需大量人工后期修复角色一致性,而寻光通过图层管理、语义级编辑等功能,使多分镜头间的人物与场景保持统一。
二、寻光的主要功能和特点
- 一站式创作工作流
- 剧本与分镜自动生成:输入文本剧本,AI自动生成分镜描述和画面,支持自定义修改。
- 分镜管理:视频项目被抽象为多分镜头,用户可拖拽调整顺序,新增或替换分镜内容。
- 多模态生成支持:支持文生图、图生视频、运镜控制(水平/垂直移动、变焦缩放)。
- 精准可控的编辑能力
- 图层编辑(核心突破):
- 前景生成:输入文本生成透明背景视频,一键融合到其他背景中。
- 图层拆解:圈选视频中的目标(如人物、物体),AI自动拆解为独立图层,方便替换背景。
- 图层融合:将不同前景与背景组合,保持多分镜头间元素一致性。
- 局部精细化编辑:
- 目标新增/消除/修改:框选区域即可添加或删除物体(如视频中消除路人、水母变粉色)。
- 口型控制:上传图片或视频,添加文本或音频后AI自动同步口型。
- 风格迁移:支持梵高画、水彩画等20+艺术风格转换。
- 运镜控制:模拟摄像机运动,如推进、拉远、环绕。
- 图层编辑(核心突破):
- 用户友好交互设计
- 界面类似PPT操作逻辑,分镜与场景可通过拖拽管理。
- 部分功能(如目标消除)提供智能选择、框选、擦除三种模式,适配不同操作习惯。
- 技术支撑
- 基于达摩院视觉技术实验室的多模态理解-生成框架,重点研究精准生成、可控编辑、3D内容处理。
三、如何使用寻光?详细操作指南
- 访问与注册
- 官网地址:https://xunguang.com。
- 注册登录后即可使用,公测阶段免费开放部分功能。
- 核心流程(以创作短片为例)
- 步骤1:创建项目 点击“开始创作→AI短片创作”,输入剧本(可借助Kimi等工具生成)。
- 步骤2:生成分镜 AI自动将剧本拆分为分镜描述+画面,用户可确认或上传自定义素材。
- 步骤3:视频生成 选择“图生视频”或“运镜控制”将静态分镜转为动态视频(最长4秒)。
- 步骤4:编辑优化
- 口型同步:上传素材后选择“朗读文本”或“本地配音”,AI调整口型。
- 目标消除:框选不需要的物体,选择智能模型后一键清除。
- 风格转换:选择预设风格(如梵高画),一键应用。
- 步骤5:导出下载 编辑完成后导出作品,支持下载但暂不包含背景音乐与字幕。
- 注意事项
- 公测版功能受限(如视频时长≤10秒),部分高级功能(如换脸、姿态控制)未开放。
- 复杂动作视频的风格转换效果可能不理想(如跳舞视频易模糊)。
四、寻光的官方地址与获取方式
- 官方网站:https://xunguang.com。
- 获取方式:直接访问注册,无需内测申请。公测期间免费使用基础功能,每日赠送100“光点”(可处理10个视频)。
五、寻光 vs 竞品对比分析
| 功能 | 寻光 | Sora类工具 | 传统工具(如Premiere) |
|---|---|---|---|
| 工作流整合 | 一站式剧本-分镜-编辑 | 仅视频生成,需多工具协作 | 需手动串联多个软件 |
| 一致性控制 | 图层管理保证多镜头统一 | 依赖人工后期 | 手动关键帧调整 |
| 操作门槛 | 低(PPT式交互) | 中(需提示词技巧) | 高(需专业技能) |
| 典型功能 | 图层编辑、口型同步、目标消除 | 文本生成视频 | 精细像素级编辑 |
| 收费模式 | 公测免费 | 按生成次数收费 | 订阅制(价格高) |
优劣势分析:
- 优势:寻光在可控编辑、工作流效率上领先,尤其适合快速制作PUGC内容。
- 不足:视频生成质量暂不及Sora(如动态画面易扭曲),且长视频支持弱。
六、寻光的典型应用场景
- 短视频创作:个人用户快速生成口型同步视频或风格化短片。
- 教育培训:教师制作分镜式教学视频,AI辅助演示复杂概念。
- 市场营销:企业低成本生成产品宣传片,一键替换背景适应多平台。
- 影视预制作:团队用分镜生成功能快速验证剧本可行性。
七、寻光能为用户带来的价值
- 效率提升:传统需数小时的剪辑工作可缩短至分钟级。
- 成本降低:免费公测策略减少专业软件订阅费用。
- 创意激发:图层融合等功能帮助非专业用户实现复杂特效。
八、寻光最新动态(2025年)
- 2025年1月:公测版开放三大核心功能(口型控制、目标消除、风格转换),每日免费处理10个视频。
- 计划上线功能:换脸、姿势控制、画质增强、超分辨率等。
- 重要更新:相较于2024年内测版,公测版简化了界面,聚焦最实用编辑工具。
九、常见问题FAQ
- 寻光完全免费吗?
- 公测阶段免费,每日100光点(处理10个视频)。未来可能对高级功能收费。
- 生成视频的最大长度?
- 当前单段视频最长4秒,复杂内容需分镜拼接。
- 如何保证多分镜头的人物一致性?
- 通过图层拆解与融合功能,AI自动跟踪同一角色跨镜头。
- 支持添加字幕或背景音乐吗?
- 暂不支持,需导出后使用剪映等工具后期添加。
- 寻光能否替代专业视频软件?
- 适合快速制作轻量视频,但复杂影视制作仍需结合专业工具。
十、总结
寻光作为阿里达摩院布局AIGC视频领域的关键产品,通过一站式工作流与图层级可控编辑解决了AI视频生成的一致性难题。其PPT式交互降低了创作门槛,使非专业用户也能高效产出内容。尽管在动态画面生成质量上仍有提升空间,但公测免费策略及持续功能更新(如口型控制、目标消除)已展现其潜力。对于短视频创作者、教育工作者及中小型企业,寻光无疑是2025年值得尝试的AI视频工具。
参考文章及数据来源
- 《达摩院发布一站式AI视频创作平台”寻光” 打造全新AI工作流》- 新华网(2024年7月7日)
- 《达摩院跨入 AIGC 深水区,发布一站式 AI 视频创作平台「寻光」》- 新浪科技(2024年7月10日)
- 《阿里达摩院推出一站式 AI 视频创作平台“寻光”》- IT之家(2024年7月6日)
- 《AI视频创作一条龙!达摩院“寻光”平台炸场WAIC》- 量子位(2024年7月5日)
- 《阿里AI神器:寻光免费体验,视频编辑效率翻倍》- 微信公众号(2025年1月18日)
- 《免费可用!10种常见视频功能,1个平台全部搞定》- 掘金(2025年1月17日)
- 《阿里达摩院这款「一站式」AI视频创作平台,一键将剧本生成视频!实测体验》- 掘金(2024年9月14日)
数据统计
更多AI产品信息
寻光AI-一站式AI视频创作平台
已有 287 次访问体验
已收录
申请修改
寻光AI-一站式AI视频创作平台的官网地址是?
寻光AI-一站式AI视频创作平台的官网及网页版入口是:https://xunguang.com 官网入口👈
网站流量数据说明
网站数据仅供参考。评估因素包括访问速度、搜索引擎收录、用户体验等。 如需获取详细数据(如IP、PV、跳出率等),请联系站长获取。
推荐数据源
爱站/AITDK
关于寻光AI-一站式AI视频创作平台的特别声明
AI产品库AIProductHub是一个专注于AI产品收录与分享的网站平台,平台收录了1000余款AI产品,覆盖创作、办公、编程、视频生成、电商、设计、写作、图像生成等多个领域和行业,平台旨在帮助更多的用户发现更好用的AI产品。本站【AI产品库AIProductHub】提供的【寻光AI-一站式AI视频创作平台】信息来源于网络。 对于该外部链接的指向,不由【AI产品库AIProductHub】实际控制。【寻光AI-一站式AI视频创作平台】在【2025-11-11 16:44】收录时, 该网页内容属于合规合法,后期如出现违规内容,可直接联系网站管理员删除,【AI产品库AIProductHub】不承担任何责任。
本文地址:https://aiproducthub.cn/sites/alibaba-xunguang-ai.html 转载请注明来源
相关导航

Write your novel or screenplay faster with the best AI tool for fiction. Start for free today and see why The New Yorker calls it "a salvation" for writers and why NY Times, The Verge, and many more love Sudowrite.

堆友—AI设计生产力工具:零门槛AI绘画+多种电商设计神器
堆友是Alibaba Design打造的设计师全成长周期服务平台

Upscayl
From Science Fiction to Rea...

Vizard-AI视频编辑工具
Vizard AI是一款通过人工智能自动识别长视频中的亮点并生成多平台适配短视频的剪辑工具。

文多多AiPPT
文多多AiPPT是一款通过AI技术一键生成专业PPT的工具,具备多模态输入、企业级安全部署和智能排版功能。

Gemini 3.0
Gemini 3.0是谷歌推出的新一代多模态AI模型,具备百万级上下文处理、深度推理和代理式编码能力,支持文本、图像、音频、视频等混合输入。

Outplay: Sales Engagement & Sales Automation Platform
Outplay is an all-in-one multichannel sales engagement platform that helps sales teams close more deals and significantly increase revenue. 14-day free trial.

Me.bot
Me.bot是一款通过用户记忆创建AI数字分身的应用,让用户的思维和个性得以数字化保存和表达。
暂无评论...


















