欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

网站优化不能忽略的环节环节--网站地图

程序员文章站 2022-06-12 22:22:38
...
新站上线了,站长们不能忽略的一个网站优化环节--网站地图。


Sitemap 可以让管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。


下面以Google搜索引擎为例讲解一下。


Google Sitemap协议
Google SiteMap Protocol是google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。
我们来看看Google Sitemap的XML格式以及它的6个标签是什么样子的。
下面是我用站长网站生成工具获取本站首页的sitemap.xml


 
- 
- http://www.w3note.com2012-09-14daily0.6


xml标签节点的意义:

大于号 > > >

小于号
   标签是用来指定该链接的最后更新时间,这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新对该链接内容进行分析和提取关键字。
年:YYYY(2005)
  年和月:YYYY-MM(2005-06)
  年月日:YYYY-MM-DD(2005-06-04)
  年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
  年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
  这里需注意的是TZD,TZD指定就是本地时间区域标记,中国是+08:00

   标签告诉Google此链接可能会出现的更新频率,比如首页肯定就要用always(经常),而对于很久前的链接或者不再更新内容的链接就可以用yearly(每年)。这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly","never"。

   是用来指定此链接相对于其他链接的优先权比值,此值定于0.0 - 1.0之间,一个网页的默认优先级为 0.5。