时间:2026年5月23日
地点:广东省深圳市
人物:中国大百科全书出版社等22家出版、传媒、版权、科技领域权威单位
事件详情:人工智能高质量语料库建设共建单位启动会议在深圳举行,首批22家出版、传媒、版权、科技领域权威单位联合签署《人工智能高质量语料库建设公约》,确立"先授权、后使用"的原则,向AI语料侵权顽疾正式亮剑。当前国内人工智能产业加速落地,大模型对优质知识语料需求呈爆发式增长,但行业长期存在野蛮生长现象:不少AI大模型直接网络爬取原创内容、拆解正版出版物、盗用图文音视频资源用于模型训练。
背景:版权确权难、授权难、维权难成为制约行业高质量发展的核心痛点。不少AI大模型无序爬取、盗版拆解、侵权商用,既严重侵害内容创作方与出版机构合法权益,也因语料来源杂乱、内容失准,造成大模型输出谬误频出、逻辑失真、幻觉严重等问题,更暗藏数据安全与文化安全潜在风险。
影响:
- 从源头遏制AI版权侵权乱象,推动人工智能产业驶入合规化、高质量发展快车道
- 建立常态化版权协同保护机制,统一梳理版权权属清单,打通版权确权、流转、授权全链条通道
- 引入区块链技术赋能全流程管理,实现语料入库、授权流转、商业交易全程留痕、可溯源、可监管
总结:《共建公约》明确要求所有用于AI训练的文字、图表、图片、音视频等各类素材,必须提前取得合法版权授权,坚决杜绝无授权抓取、私自拆解、侵权商用等违规行为。中国大百科全书出版社社长高世屹表示,将严格恪守"先授权、后使用"准则,全力打造可授权、可追溯、可商用的国家级正版高质量语料库。共建阵营还将引入区块链技术,从技术层面彻底破解长期困扰行业的授权难、确权难、追责难三大痛点,树立国内AI语料正版化、规范化使用标杆。
参考来源:
https://k.sina.com.cn/article_1784473157_6a5ce64502003l17y.html
http://www.chinanews.com.cn/cj/2026/05-24/10627643.shtml








