时间: 2026年5月23日
地点: 中国深圳
人物: 中国大百科全书出版社等22家权威机构
事件详情: 人工智能高质量语料库建设共建单位启动会议在深圳举行,首批22家出版、传媒、版权、科技领域权威单位联合签署《人工智能高质量语料库建设公约》,确立先授权后使用的原则,向AI语料侵权顽疾正式亮剑。这是国内首次大规模构建正版化AI训练语料库。
背景: 当前国内AI产业加速落地,大模型对优质知识语料需求呈爆发式增长。但行业长期存在野蛮生长现象,不少AI大模型直接网络爬取原创内容、拆解正版出版物、盗用图文音视频资源用于模型训练,既侵害内容创作方权益,也因语料来源杂乱导致大模型输出谬误频出、幻觉严重等问题。
影响:
- 确立先授权后使用原则,从源头遏制AI版权侵权乱象
- 打造可授权可追溯可商用的国家级正版高质量语料库
- 引入区块链技术赋能全流程管理,实现语料入库授权流转全程留痕
- 破解长期困扰行业的授权难确权难追责难三大痛点
- 树立国内AI语料正版化规范化使用标杆
- 为人工智能大模型健康发展筑牢版权屏障
- 推动AI产业驶入合规化高质量发展快车道
总结: 此次22家机构共建AI高质量语料库具有开创性意义,标志着中国AI产业从野蛮生长向规范化发展转型。通过确立先授权后使用原则,建立常态化版权协同保护机制,引入区块链技术实现全程可追溯,从根本上破解了AI语料版权保护的三大痛点。这一举措不仅保护了内容创作方的合法权益,更为AI大模型提供了高质量正版语料支撑,将显著提升大模型的准确性和可靠性,推动AI产业健康发展。
参考来源:
http://www.chinanews.com.cn/sh/2026/05-24/10627710.shtml
https://new.qq.com/rain/a/20260524A087AJ00
http://www.news.cn/book/20260525/4b99e469b7664aefa6b9f4b5cc5995b0/c.html
http://k.sina.com.cn/article_1784473157_6a5ce64502003l17y.html
http://finance.sina.com.cn/roll/2026-05-24/doc-inhyyxuk4311599.shtml
http://www.xinhuanet.com/book/20260525/4b99e469b7664aefa6b9f4b5cc5995b0/c.html
http://www.cnpubg.com/news/2026/0525/71989.shtml









