单页应用(Single Page Application)愈来愈受web开发者欢迎,单页应用的体验能够模拟原生应用,一次开发,多端兼容。单页应用并非一个全新发明的技术,而是随着互联网的发展,知足用户体验的一种综合技术。前端
一直以来,搜索引擎优化(SEO)是开发者容易忽略的部分。SEO是针对搜索(Google、百度、雅虎搜索等)在技术细节上的优化,例如语义、搜索关键词与内容相关性、收录量、搜索排名等。SEO也是同行、市场竞争经常使用的的营销手段。Google、百度的搜索结果是重要的用户入口,腾讯云(www.qcloud.com)有30%左右的流量来自搜索引擎。所以SEO在品牌、营销、用户量的纬度是很是重要的基础能力。node
那么单页应用与传统直出页面在SEO方面有哪些不一样之处呢?web
单页应用实际是把视图(View)渲染从Server交给浏览器,Server只提供JSON格式数据,视图和内容都是经过本地JavaScript来组织和渲染。而搜索搜索引擎抓取的内容,须要有完整的HTML和内容,单页应用架构的站点,并不能很好的支持搜索。后端
若是站点在用户体验和搜索友好权衡时,若是咱们作到更好的体验,也作到友好的搜索支持,既是一举两得。api
单页应用只有一个页面,视图的变化一般是经过路由(route)来驱动,首先,咱们先来谈一谈单页应用的URL中的#号,不少采用单元结构网站的URL都出现了这个符号。浏览器
#
号在浏览器的URL中是一个锚点,在当前页改变#
号的参数,页面会跳转到锚点所在的位置,经过JavaScript咱们能够获取到#
号后的参数:架构
location.hash // 获取URL hash location.hash = "#list" //改变URL hash
改变#
号后的参数,页面并不会重载,因而大多数的单页架构网站,都在URL中采用#
号来做为当前视图的URL地址,例如:优化
example.com/#index //首页视图 example.com/#list //列表页视图 example.com/#list/1 //id为1的列表信息的视图
Backbone.js就是经过改变#
号参数来组织视图,这里有一个demo能够很直观的体验URL的变化。网站
看过这个demo,你或许会发现很熟悉的符号#!
,Twitter曾在URL使用这个标识。这个标识是Google提出(AJAX 抓取:网站站长和开发人员指南1):搜索引擎
由于复杂的单页架构页面,对Google来讲抓取比较困难,因而给开发者制定一个规范:
#!
符号,例如example.com/#!/detail/1
,因而Google开始抓取example.com/?_escaped_fragment_=/detail/1
;_escaped_fragment_
这个参数是Google指定的命名,若是开发者但愿把网站内容提交给Google,就必须经过这个参数生成静态页面。
根据上面的demo,我简单示例一下Google要抓取的页面的样子:
http://119.28.4.22/?escapedfragment_=/detail/1
如此以来,就须要Server经过生成静态的内容以便Google抓取。
如下将简单介绍,单页架构,爬虫访问根目录时若是配置Server端的路由。
当Google访问119.28.4.22/#!/detail/1
时,会自动转化成http://119.28.4.22/?_escaped_fragment_=/detail/1
,以Nginx为例:
if ($args ~ _escaped_fragment_) { rewrite ^ /api; }
/api
为后台服务的接口,已nodejs为例,代理设置以下:
upstream nodejs { server 127.0.0.1:3000; } location /api { proxy_set_header X-Request-URI $request_uri; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header Host $host; proxy_set_header Port $server_port; proxy_pass http://nodejs; proxy_redirect off; }
如此,咱们便将Google的访问重写到/api
这个接口,而后在Server的/api
处理请求把静态内容输出便可。
Gogole的这个规范,必须有sitemap支持,由于有可能单页架构的站点,索引页面也是JavaScript渲染的。提交sitemap时,不用关注_escaped_fragment_
这个参数名,只提交带哈希符号的URL便可,例如:
http://119.28.4.22/#!/detail/1 weekly 0.5
技术潮流的步伐很快,单页应用,URL哈希处理也没渲染的方式实际上已经流行了好久,在国外不少用户数据较好的状况下,开发者会选择HTML5 History API的pushstate特性开发,在URL中抛弃#!
。可是IE六、7等低端浏览器用户状况较多的网站,#
可以很好的兼容。关于采用HTML5 History API来架构单页应用的方案,也欢迎讨论。
参考1: https://support.google.com/webmasters/answer/174992?hl=zh-Hans