欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

网站蜘蛛日志分析

程序员文章站 2022-04-27 11:30:38
不清楚我们的网站百度蜘蛛是否来过,不知道我们网站百度蜘蛛是否能来,那你可以利用网站日志来分析蜘蛛是否来过,爬行过哪些页面,什么时候来过等问题,那么我们......

不清楚我们的网站百度蜘蛛是否来过,不知道我们网站百度蜘蛛是否能来,那你可以利用网站日志来分析蜘蛛是否来过,爬行过哪些页面,什么时候来过等问题,那么我们应该如何去分析网站蜘蛛日志。

网站蜘蛛日志分析

在我们分析网站日志的前提是必须要下载iss日志,一般的情况下,我们都使用ftp,那么iss日志均为空间商会给你提供下载地址。一般是在weblog文件中,我们可以直接从这一文件中获取站点的日志文件。一般的情况下,iss日志是每天生成一次,但是对于网站较大,站点内容较多的可以设置每小时生成一次。

如何分析蜘蛛日志

以上的代码是我从自己的空间下载的一段日志,现在与大家一起来分析一下,这段代码具体意思如下:

61.135.168.22:来路ip,也就是说这个用户或者蜘蛛进来我们网站的ip是多少。

11/feb/2014:04:02:45:时间2014年2月11日早上4点02分45秒。

/seojishu/161.html:蜘蛛访问的页面,加上网站的主域名如:https://www.ssffx.com/seojishu/161.html

200:表示能够正常访问你的网站。

8450:表示此次加载了8450个字节。

baiduspider:百度蜘蛛的全名。

以上是网站日志分析的细节,那么以上的内容有两点,是我们需要注意的,同时在分析的过程中也需要记住的。那就是状态代码和程序名的解析。

状态代码

200 - 服务器成功返回网页

404 - 请求的网页不存在

503 - 服务器暂时不可用

500 - 服务器出现错误

蜘蛛名称

百度(baidu)爬虫名称(baiduspider)

谷歌(google)爬虫名称(googlebot)

雅虎(yahoo)爬虫名称(yahoo slurp)

有道(yodao)蜘蛛名称(yodaobot)

搜狗(sogou)蜘蛛名称(sogou spider)

msn的蜘蛛名称:msnbot

如何让蜘蛛经常访问我们的网站

那么看懂这些数据以后,很多朋友可能会很失望,觉得自己的网站蜘蛛访问的很少甚至没有访问记录,那么你也别担心,可能是你网站的一些小问题引起了蜘蛛的不关注。下面来看看面对蜘蛛不关注我们的网站,我们应该如何操作吧。

定时更新:对于小网站或者博客网站,我们可以定时更新1-3篇少量信息,那么对于论坛门户这种栏目较多的网站,我们就需要更具自己网站的情况来更新,以便获得蜘蛛的青睐。

网站地图:制作蜘蛛网站地图,当蜘蛛在抓取你的页面,蜘蛛会先抓取你的robots文件,所以网站地图写在robots文件里面来引导蜘蛛抓取网站地图内容。

外链引导:我曾经做过一次这样的实验,新建一个文本页面的网站,不做任何操作,仅仅在a5论坛发了一个纯文本链接,第二天百度收录了我的那个文本页面。这一点说明seo外链是可以引导百度蜘蛛来收录你的网站的。

推荐此文:如果你的条件允许的情况下,你可以将你的内容文字推荐到首页,或者在其他内容页推荐,因为一个网站首页的权重是最高的,所以在首页推荐的情况下,是非常容易就可以收录你的文章。