蜘蛛的依旧疯狂与园子的新畅想:尝试放出被屏蔽的百度蜘蛛网段

发布时间 2023-09-20 13:09:05作者: 博客园团队

因为看到博文 【故障公告】它(变异的百度蜘蛛)又来了,雪上加霜又加盐的三月,百度搜索部门的人昨天对园子进行了线上回访,让我们看到了一丝希望。

今天早上,带着这丝希望,我们试着放出今年3月因为过于疯狂、喜欢在别人地盘上飙车而被我们屏蔽的百度蜘蛛网段——116.179.37.0/24,看看半年之后它是否“疯”子回头,结果依旧是意料之中的疯狂依旧,“疯”性难移。

放开后,园子博客站点的 web 服务器 cpu 立马飙升,“飙”字货真价实,不带一点夸张,放开后的 cpu 是屏蔽时的三倍左右。

放开后:

屏蔽时:

这次我们专门记录了放开阶段百度蜘蛛的请求量,取 9:00-9:04 的5分钟数据看一下,请求量是 277358(27万),QPS(每秒请求数)是 924(近一千)。

面对百度蜘蛛丝毫不减的疯狂,那一丝希望瞬间一扫而光,抛开小插曲带来的失望,燃起我们的新希望。

希望在没有百度的日子里,园子的发展更加阳光。

希望在没有百度的日子里,我们能够发挥开源力量。

在被百度离开一年多的日子里,我们产生了新的畅想——待园子发展壮大后,我们会发起一个公益基金会,发起一个开源搜索引擎项目,至少给开发者提供一个没有疯狂蜘蛛、基于公平透明规则的搜索引擎。