单页应用SEO浅谈设计
seo
一直以来,搜索引擎优化(seo)是开发者容易忽略的部分。seo是针对搜索(google、百度、雅虎搜索等)在技术细节上的优化,例如语义、搜索关键词与内容相关性、收录量、搜索排名等。seo也是同行、市场竞争常用的的营销手段。google、百度的搜索结果是重要的用户入口,腾讯云(www.qcloud.com)有30%左右的流量来自搜索引擎。因此seo在品牌、营销、用户量的纬度是非常重要的基础能力。
那么单页应用与传统直出页面在seo方面有哪些不同之处呢?
单页应用的优点
更好的用户体验,让用户在web感受natvie的速度和流畅;
经典mvc开发模式,前后端各负其责。
一套server api,多端使用(web、移动app等)
重前端,业务逻辑全部在本地操作,数据都需要通过ajax同步、提交;
对搜索引擎不友好
单页应用实际是把视图(view)渲染从server交给浏览器,server只提供json格式数据,视图和内容都是通过本地javascript来组织和渲染。而搜索搜索引擎抓取的内容,需要有完整的html和内容,单页应用架构的站点,并不能很好的支持搜索。
如果站点在用户体验和搜索友好权衡时,如果我们做到更好的体验,也做到友好的搜索支持,既是一箭双雕。
url中的哈希(#号)
单页应用只有一个页面,视图的变化通常是通过路由(route)来驱动,首先,我们先来谈一谈单页应用的url中的#号,很多采用单元结构王皓咱的url都出现了这个符号。
#号在浏览器的url中是一个锚点,在当前页改变#号的参数,页面会跳转到锚点所在的位置,通过javascript我们可以获取到#号后的参数:
location.hash // 获取url hash
location.hash = "#list" //改变url hash
改变#号后的参数,页面并不会重载,于是大多数的单页架构网站,都在url中采用#号来作为当前视图的url地址,例如:
example.com/#index //首页视图
example.com/#list //列表页视图
example.com/#list/1 //id为1的列表信息的视图
backbone.js就是通过改变#号参数来组织视图,这里有一个demo可以很直观的体验url的变化。
看过这个demo,你获取会发现很熟悉的符号#!,twitter曾在url使用这个标识。这个标识是google提出。(ajax 抓取:网站站长和开发人员指南1:
因为复杂的单页架构页面,对google来说抓取比较困难,于是给开发者制定一个规范:
1、网站提交sitemap给google;
2、google发现url里有#!符号,例如example.com/#!/detail/1,于是google开始抓取
example.com/?_escaped_fragment_=/detail/1;
_escaped_fragment_这个参数是google指定的命名,如果开发者希望把网站内容提交给google,就必须通过这个参数生成静态页面。
根据上面的demo,我简单示例一下google要抓取的页面的样子:
http://119.28.4.22/?escapedfragment_=/detail/1
如此以来,就需要server通过生成静态的内容以便google抓取。
以下将简单介绍,单页架构,爬虫访问根目录时如果配置server端的路由。
判断爬虫
当google访问
119.28.4.22/#!/detail/1
时,会自动转化成
http://119.28.4.22/?_escaped_fragment_=/detail/1
以nginx为例:
if ($args ~ _escaped_fragment_) {
rewrite ^ /api;
}
/api为后台服务的接口,已nodejs为例,代理设置如下:
upstream nodejs {
server 127.0.0.1:3000;
}
location /api {
proxy_set_header x-request-uri $request_uri;
proxy_set_header x-real-ip $remote_addr;
proxy_set_header x-forwarded-for $proxy_add_x_forwarded_for;
proxy_set_header host $
host;
proxy_set_header port $server_port;
proxy_pass http://nodejs;
proxy_redirect off;
}
如此,我们便将google的访问重写到
/api
这个接口,然后在server的
/api
处理请求把静态内容输出即可。
sitemap
gogole的这个规范,必须有sitemap支持,因为有可能单页架构的站点,索引页面也是javascript渲染的。提交sitemap时,不用关注_escaped_fragment_这个参数名,只提交带哈希符号的url即可,例如:
http://119.28.4.22/#!/detail/1
weekly
0.5
结语
技术潮流的步伐很快,单页应用,url哈希处理也没渲染的方式实际上已经流行了很久,在国外很多用户数据较好的情况下,开发者会选择html5 history api的pushstate特性开发,在url中抛弃#!。但是ie6、7等低端浏览器用户情况较多的网站,#能够很好的兼容。