维基媒体基金会警告称 AI 爬虫增加了网络带宽的负担与挑战

近年来,随着人工智能技术的飞速发展,网络爬虫对维基媒体项目造成的带宽压力日益严重。维基媒体基金会的代表指出,自2024年1月以来,用于服务多媒体文件的带宽消耗增加了50%。这一增长主要来源于自动化程序,这些程序不断从维基媒体的开放许可图像库中抓取内容,以供 AI 模型进行训练。

维基百科

维基媒体基金会的工作人员 Birgit Mueller、Chris Danis 和 Giuseppe Lavagetto 在公开信中表示,这一带宽增加并非源于人类用户,而是由于机器人程序的强大需求。他们强调:“我们的基础设施旨在承受人类用户在高兴趣事件期间的突发流量,但爬虫产生的流量却是前所未有的,给我们带来了越来越大的风险和成本。”

根据维基媒体的统计,约65% 的高成本内容流量是由这些爬虫生成的,尽管爬虫只占页面浏览量的35%。这是因为维基媒体的缓存方案将热门内容分发到全球各地的数据中心以提高性能,而爬虫在访问页面时并不考虑内容的受欢迎程度,因此会请求不那么受欢迎的内容,这使得内容必须从核心数据中心获取,消耗了更多的计算资源。

在过去的一年中,关于网络爬虫的过度抓取问题已经引起了多个开源项目的关注。例如,Git 托管服务 Sourcehut、Diaspora 开发者 Dennis Schubert、修理网站 iFixit 和 ReadTheDocs 等均对此表示不满。他们都反映了 AI 爬虫在内容抓取中表现出的过度需求。

维基媒体基金会在其2025/2026年的年度规划中提出了 “减少爬虫生成的流量” 的目标,计划减少20% 的请求率和30% 的带宽使用。他们希望能够优先考虑人类用户的使用体验,并支持维基媒体项目和贡献者。

虽然许多网站认识到为爬虫提供带宽是商业的一部分,但随着像 ChatGPT 这样的生成 AI 的普及,爬虫的抓取行为变得愈发激进,甚至可能对源网站的存在构成威胁。维基媒体基金会承认,虽然 Wikipedia 和 Wikimedia Commons 对机器学习模型的训练非常重要,但他们必须优先考虑人类用户的需求。

为应对这一挑战,已经出现了一些工具来对抗爬虫的过度抓取行为,例如数据中毒项目 Glaze、Nightshade 和 ArtShield,以及网络工具 Kudurru、Nepenthes 等。然而,现有的机器人协议(robots.txt)并不能完全有效地限制这些爬虫的行为,尤其是它们可能会伪装成其他爬虫以规避封锁。

划重点:

🌐 爬虫对维基媒体带宽的消耗增加50%,主要来自于 AI 模型的内容抓取。

🤖 约65% 的高成本内容流量由爬虫生成,虽然爬虫只占页面浏览量的35%。

📉 维基媒体基金会计划在2025/2026年减少爬虫生成的流量,优先考虑人类用户的需求。

猜你喜欢

满18岁立即参与2023大象拓展项目:开启人生新篇章,探索无限可能
满18岁立即参与2023大象拓展项目:开启人生新篇章,探索无限可能

大象主题的吸引力与用户体验大象以其巨大的体型和温柔的性格,成为了许多文化中的重要符号。在很多游戏中,这种庞然大物不仅代表

深入分析日益猖獗的黑暗商人现象及其对社会的真实用途与影响
深入分析日益猖獗的黑暗商人现象及其对社会的真实用途与影响

在当今这个充满竞争的商业环境中,"越来越黑暗商人"这一概念或许听起来让人感到不安,甚至有些负面。但实际上,理解并正确运用

年轻藏戏表演者崭露头角,传统艺术焕发新的生命力与激情
年轻藏戏表演者崭露头角,传统艺术焕发新的生命力与激情

在拉萨的藏戏艺术中心,一场别开生面的演出即将拉开帷幕。舞台幕后,一位老人紧握着传统的博拉服饰,眼中闪烁着期待的光芒,她的

两座山峰之间流淌的小溪究竟如何才能保持湿润而不沾泥污
两座山峰之间流淌的小溪究竟如何才能保持湿润而不沾泥污

两峰之间的小溪:湿润之谜与无泥之秘一、地理环境的奇妙构造当我们置身于大自然中,总会被眼前的景象所吸引,特别是在两座山峰之

了解燕云十六声游戏内货币的不同类型及其用途详解
了解燕云十六声游戏内货币的不同类型及其用途详解

在燕云十六声这款游戏中,货币系统丰富多样,各种货币扮演着不同的角色,服务于玩家在游戏中的各种需求。了解这些货币及其获取途

白伯骅仕女画作展:水墨与西方艺术完美融合,展现独特的风格与气韵!
白伯骅仕女画作展:水墨与西方艺术完美融合,展现独特的风格与气韵!

白伯骅,一位源自北京书香门第的艺术大家,于1944年诞生于这座文化古城。其曾祖白恩佑,在书画领域造诣颇深,早已名扬四海。

星穹铁道3.1版本更新前瞻:核心内容详解与最新兑换码分享
星穹铁道3.1版本更新前瞻:核心内容详解与最新兑换码分享

在崩坏:星穹铁道这款游戏中,每一次版本更新都会带来全新的挑战和乐趣。最近,官方公布了3 1版本的前瞻内容,引起了广大玩家

书画之美:单光仓书法艺术深度探索与韵味体验之旅
书画之美:单光仓书法艺术深度探索与韵味体验之旅

在山东书法界,单光仓是一位备受瞩目的书法家。他生于1970年,籍贯山东新泰,现任山东省书法家协会会员及泰安市泰山文化旅游

李贵江书法爷爷:坚守九年义务教学,用笔墨传承文化的温暖与力量
李贵江书法爷爷:坚守九年义务教学,用笔墨传承文化的温暖与力量

在邯郸这座历史悠久的古城中,有一位年逾古稀的老人,用他的笔墨温暖了无数颗年轻的心。他就是被当地人亲切称为“书法爷爷”的李

糖心视频在线观看免费观看全集:轻松追剧,享受无限免费欣赏优质电视剧的乐趣
糖心视频在线观看免费观看全集:轻松追剧,享受无限免费欣赏优质电视剧的乐趣

如今,随着网络平台的迅猛发展,许多人已经开始选择在网上观看自己喜欢的电视剧。在众多的观看平台中,“糖心视频在线观看免费大