时间:2026年7月1日
地点:美国加州旧金山
人物:Cloudflare公司、出版商(新闻网站、内容创作者)、AI公司(OpenAI、Anthropic、Google等)
事件详情:互联网基础设施巨头Cloudflare于7月1日宣布一项重大政策变更:从2026年9月15日起,Cloudflare的默认设置将自动阻止"混合用途"的网络爬虫访问任何展示广告的页面。所谓"混合用途"爬虫,是指那些同时用于搜索引擎索引、AI训练和AI智能体服务的爬虫程序。新的默认设置将适用于所有新Cloudflare客户、现有客户的新建站点以及所有现有免费客户。站点所有者可以自行调整设置来改变这一行为。Cloudflare此举实质上是在向AI公司施压:如果他们想继续抓取出版商的内容用于AI训练,就必须将用于搜索索引的爬虫与用于AI训练和智能体的爬虫明确分离,否则将被默认屏蔽。
背景:近年来,AI公司与内容创作者之间的版权争议愈演愈烈。主流AI公司使用网络爬虫抓取大量网页内容用于训练大语言模型,而内容创作者和出版商认为这构成了未经授权的版权使用。此前,OpenAI、Google等公司与多家新闻机构签署了内容授权协议,但更多的中小型出版商并未获得任何补偿。Cloudflare作为全球最大的CDN和网络安全服务商之一,服务着全球数百万网站,其网络爬虫管理政策对互联网生态具有重大影响力。业内分析认为,Cloudflare此举将加速推动AI公司建立透明的爬虫分类标准,并促进AI公司与出版商之间形成更公平的内容付费机制。
影响:
- 对AI公司而言,需要在2026年9月15日前完成技术架构调整,将搜索索引爬虫与AI训练爬虫明确分离,否则将失去对大量Cloudflare保护网站的内容访问权限,这可能推高AI训练数据的获取成本
- 对出版商和内容创作者来说,Cloudflare的新政赋予了更强的内容控制权——他们可以明确允许用于搜索的爬虫而阻止用于AI训练的爬虫,或要求AI公司为其训练数据付费
- 对整个AI行业而言,Cloudflare的这一举措可能引发连锁反应——其他CDN和互联网基础设施服务商可能效仿,推动形成行业统一标准,加速AI领域的内容授权和付费机制成熟
总结:Cloudflare的这项政策变更标志着AI内容获取从"野蛮生长"进入"规范付费"时代的重要转折。通过强制AI公司将搜索爬虫与训练爬虫分离,Cloudflare实质上在为内容创作者和出版商创造议价空间——让他们能够决定自己的内容是否被用于AI训练以及以何种条件被使用。这不仅是技术层面的调整,更是对AI行业"先抓取再谈判"模式的根本性挑战。随着9月15日截止日的临近,AI公司与出版商之间的博弈将进入新的阶段,内容生态的公平性制度建设正在加速推进。
参考来源:
- https://techcrunch.com/2026/07/01/cloudflares-new-policy-pushes-ai-companies-to-pay-for-publishers-content/
- https://blog.cloudflare.com/2026/ai-crawler-policy-update/
- https://www.theverge.com/2026/7/1/cloudflare-ai-crawler-policy
- https://www.reuters.com/technology/cloudflare-ai-content-policy-2026-07-01/
- https://www.wired.com/story/cloudflare-ai-crawlers-publishers/









