矮人村

 找回密码
 立即注册
查看: 276|回复: 0
打印 上一主题 下一主题

研究网站收录和快照不及时的原因

[复制链接]

33

主题

33

帖子

237

积分

注册会员

Rank: 2

积分
237
QQ
跳转到指定楼层
楼主
发表于 2018-3-10 23:21:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
对于SEO诊断一直是我坚持的一项工作,很多都来自于一些朋友的提问咨询,以及自己网站问题的发现和研究。今天我再给大家带来一个诊断案例,主要问题式针对网站收录和快照不及时的问题。
  首先我建议这位朋友查看网站的LOG日志,因为LOG日志能够反映百度蜘蛛在网站内部的抓取情况。据我了解,目前很多朋友是没有查看LOG日志的习惯的,或者说多查看LOG日志有心无力,这位朋友就是,他说他有查看LOG日志,但是却不懂得怎么去分析。下面简单的介绍下我的分析思路。
  1、查看搜索引擎蜘蛛的抓取概要分析,了解各个搜索引擎蜘蛛的访问次数,总停留时间,总抓取量和所占比例,下面是朋友网站的概要分析(利用光年日志分析工具查看结果),其中可以很清楚的看出,百度蜘蛛对于网站的抓取量还是不错的,有292词,访问次数有126次,总停留时间%。
  有的朋友可能会产生疑惑,既然百度蜘蛛总停留时间这么长,单次停留时间也不低(PS:蜘蛛单次停留时间=总停留时间/访问次数=分钟),那么为什么网站的收录却跟不上呢?带着这样的疑问,下面再分析下百度蜘蛛对于其他页面的抓取。
  2、查看百度蜘蛛对于网站目录抓取的情况,从下面的抓取图中可以很清楚的看出百度蜘蛛对于home,product目录的抓取还是比较多的,对于网站内部另外一个重要的目录news抓取却不多,而这个目录就是网站每日更新做的比较多的工作目录。蜘蛛还抓取了一些后台文件目录如upload,files,img等。
  从上面的分析可以看出百度蜘蛛对于网页内部的抓取是不合理的,问题主要是:1、网站内部结构对于news栏目抓取力度不足;2、home目录作为社区,product目录作为产品中心,分散了网站蜘蛛抓取的资源;3、网站对于一些不必要抓取的目录没有很好地限制。解决问题就需要从这三个方面入手。
  1、引导蜘蛛更多的抓取news目录下面的网页,如针对更新的页面创造更多的链接入口,其中包括站内的互相链接导入,站外的外链发布等。
  2、查看网站的社区基本上已经没有更新,可以考虑先将home目录屏蔽掉,让权重和蜘蛛更多的导入进news栏目。product目录是一个比较重要的目录,但是更多的应该引导其抓取没有收录的或者新的产品。查看网站产品页面,发现对于相关产品推荐力度不够,可以在这一块进行改进。
  3、运用robots文件或者nofollow标签,对于网站不重要的目录或者页面,以及后台的一些文件进行限制。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

标签|手机版|小黑屋| 矮人村

GMT+8, 2024-10-3 08:29 , Processed in 0.109200 second(s), 35 queries , Gzip On.

Powered by 小矮人挖矿

© 2016 矮人村 版权所有

快速回复 返回顶部 返回列表