如何排除无关蜘蛛爬虫干扰高质搜索引擎蜘蛛抓取网站?

06-01 12:30 好宝宝网站收录 2

在 搜索引擎优化 过程中,你是否遇到过这样的问题:服务器访问的CPU利用率接近,页面加载速度特别慢,似乎受到了DDoS的攻击。

经过回顾,我发现原来的目标网站经常被大量无关的“爬虫”抓走,这对一个小网站来说可能是一场灾难。

因此,在进行 网站优化 时,我们需要有选择地引导特定的蜘蛛。

根据以往 SEO 经验分享,小编将通过以下几点来阐述:

一、搜索引擎爬虫

对于国内的小伙伴来说,我们都知道在SEO的过程中,我们面对的常见的爬虫就是搜索引擎的爬虫,比如 百度蜘蛛 ,还有各种搜索引擎的蜘蛛,比如:

①360Spider、SogouSpider、Bytespider

②Googlebot、Bingbot、Slurp、Teoma、iauarchiver、twiceler、MSNBot

③其他爬行动物

如果不故意配置robots.txt文件,理论上,可以对目标页进行爬网和爬网。然而,对于一些中小型网站来说,它偶尔会浪费自己的服务器资源。

此时,我们需要做出有选择性、合理的指导,特别是一些尴尬的问题,比如:你希望谷歌减少对网站的爬网,但不能完全屏蔽它,你可能需要一些提示,比如:对于具体的爬网访问,反馈不同的文章列表:

①控制更新频率表

②反馈重复性强,内容农场页面

③善意的“蜘蛛陷阱”,如flash

④如何调整对方的SEO管理平台,获取评论并进行适当调整

虽然这样的策略很可能会对页面声誉造成损害,但我可以想出一个相对“有效”的方法,合理控制那些不想频繁爬行但需要不断爬行的蜘蛛的爬行。

二、链接分析爬虫  

从目前来看,一个SEO外部链分析管理工具需要每天花费大量的服务器资源来抓取和检测每个网站的页面链接。

对于一些资源密集型的网站来说,每天爬行数千次是可能的,这种爬行动物很常见。

如果你不想让自己的网站参与其中,简单的策略是在robots协议中完全关闭此类爬虫程序。

三、内容收集爬网程序

但当我们面对一些恶意的内容收集爬虫时,就相对尴尬了。另一方经常采用“看不见”的状态,比如:模拟一个出名搜索引擎蜘蛛的名字。

要解决这个问题,只能手工判断对方庐山的真伪,比如:使用I PPA n解析命令判断真伪。

①Linux平台:主机IP

②Windows平台:nslookupip

从而确定对方的解析地址是否为相应的搜索引擎 域名 。

四、蜘蛛池爬行动物  

目前,市面上有很多人做百度蜘蛛池,其主要目的是协助更多的页面做 百度快速收录 ,但由于一些随意下载蜘蛛池的程序设计不规范。

由于没有对不同的蜘蛛进行合理的抓取和限制,服务器资源经常被服务提供商占用,很容易被关闭。

如果你试图使用这个策略来提高你的页面包含率,那么你可能需要更多的关注。

免责声明

任何关于疾病的建议都不能替代执业医师的面对面诊断,请谨慎参阅。本站不承担由此引起的法律责任。

本站上所有内容均出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

热门网站
  • 百度网盘
    百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间。
  • 网易体育
    体育,体育频道,包含体育新闻,NBA,CBA,英超,意甲,西甲,冠军杯,体育比分,足彩,福彩,体育秀色,网球,F1,棋牌,乒羽,体育论坛,中超,中国足球,综合体育等专业体育门户网站
  • 中国财经网
    以“中国财经”、“中国财经APP”、中国财经双微等为核心业务平台,实现多屏互动,重点关注宏观经济、金融、证券、上市公司、房产、科技等领域,为用户提供时效、专业、全面的财经信息及综合类服务。
  • 简书
    简书是一个优质的创作社区,在这里,你可以任性地创作,一篇短文、一张照片、一首诗、一幅画……我们相信,每个人都是生活中的艺术家,有着无穷的创造力。
  • 301解放军总医院
    中国人民解放军总医院(301医院)创建于1953年,是集医疗、保健、教学、科研于一体的大型现代化综合性医院,直属于中国人民解放军联勤保障部队。医院是中央重要保健基地,承担军委、总部等多个体系单位、官兵的医疗保健和各军区、军兵种转诊、后送的疑难病诊治任务。医院同时又是解放军医学院,以研究生教育为主,是全军唯一一所医院办学单位。
  • 武汉大学
    武汉大学(Wuhan University),简称武大(WHU),位于湖北省武汉市,是教育部直属的综合性全国重点大学, 中央直管高校,国家首批“双一流”、“985工程”、“211工程”重点建设高校。入选“101计划”、英才计划、国家建设高水平大学公派研究生项目,为医学“双一流”建设联盟、欧亚-太平洋大学联盟、中英高等教育人文联盟成员,长江中游城市群“双一流”高校联盟理事长单位。 武汉大学溯源于1893年清末湖广总督张之洞奏请清政府创办的自强学堂,历经传承演变,1928年定名为国立武汉大学,是近代中国第一批国立大学。 1960年被确定为全国重点综合性大学,1995年被确定为国家“211工程”重点建设高校。2000年武汉大学与武汉水利电力大学、武汉测绘科技大学、湖北医科大学合并组建新的武汉大学,2001年进入国家“985工程”重点建设高校行列,2017年入选国家“双一流”建设高校。
  • 厚大法考
    厚大法考隶属于北京厚大轩成教育科技股份公司,是一家集司法考试培训、法硕培训、律所、律师培训等相关法律培训服务的机构。厚大法考从成立之初凭借免费模式,各友商效仿引入免费模式,让法考行业实现对学员的教育资源共享 。2016年,厚大股份挂牌上市。2017年,随着多位名师的加入,以及厚大各职能部门的协作,厚大组成了行业学院派名师阵容。厚大罗翔老师在2020年出圈,掀起了全民法律热。截止到2023年,厚大法考图书发行量已经突破一千万册,免费课件播放量达一亿次 。
手机号码吉凶查询网