登陆

网站抓取量怎么提升?

城南二哥 2019-09-01 517人围观 ,发现0个评论

      

       网站抓取量是影响网站收录的重要因素,因此把控好网站的抓取量很重要,那么怎么来提升网站的抓取量呢?

      网站抓取量=网站的总抓取时间/网站单个页面的抓取时间

      那么自然我们可以从二个维度来提升网站的抓取量:



一、降低网站单个页面的抓取时间

      对于网站单个页面的抓取时间,主要是提高网站的性能,主要包括服务器空间以及网站代码,JS、图片压缩、视频等优化,促使网站会有很快的打开速度,使得搜索引擎程序抓取下载单页面时间变短,从而访问更多的页面,增加抓取量。


二、增加网站的总抓取时间

      网站的总抓取时间又可以细分,可以分为搜索程序的主动抓取以及被动抓取


       对于主动抓取,就是蜘蛛沿着站内的某个链接不断爬去,那么怎么来控制主动抓取时间呢?


      首先许多链接要可抓取,不要让蜘蛛程序无法识别或者无权限,比如JS跳转什么的,注册才能访问之类,然后就是网站的物理层级以及逻辑层级要简短,物理层级我们可以把一些重要的页面放在首页,缩短物理距离;逻辑层级方面网站的层级关系要简洁,比如常见的树状结构,首页-栏目页-内容页;后就是内链的设置,把网站相关的内容尽量的串联成网状,使得蜘蛛程序可以方便爬取。


至于被动抓取嘛,更多是从站外链接的角度去理解的。


       我们可以在站外建立外部链接来吸引蜘蛛来到我们网站,增加网站的抓取频次以及抓取时间,不过对于外链不要随便的去做,尽量去分享价值,就像百度的工程师LEE说的,有推荐价值的外链才是有用的,要不然只是起到吸引蜘蛛作用,我们外链的效用就大打折扣了,说的有点跑题了,当然对于有些人来说聊胜于无嘛。


       还有一点要引起大家的注意,就是要允许蜘蛛程序的爬取,这里就涉及到了robots文件的设置,其次不少网站会有反采集系统,有的服务器的防火墙,还有日志的HTTP状态码,这些都会影响到蜘蛛对于网页的抓取,从而影响收录以及流量。


》》》


请关注微信公众号
微信二维码
Powered By Z-BlogPHP