http://www.ibm.com/developerworks/cn/web/1102_niugang_csrf/javascript
简介: CSRF(Cross Site Request Forgery, 跨站域请求伪造)是一种网络的攻击方式,该攻击能够在受害者绝不知情的状况下以受害者名义伪造请求发送给受攻击站点,从而在并未受权的状况下执行在权限保护之下的操做,有很大的危害性。然而,该攻击方式并不为你们所熟知,不少网站都有 CSRF 的安全漏洞。本文首先介绍 CSRF 的基本原理与其危害性,而后就目前经常使用的几种防护方法进行分析,比较其优劣。最后,本文将以实例展现如何在网站中防护 CSRF 的攻击,并分享一些开发过程当中的最佳实践。php
CSRF(Cross Site Request Forgery, 跨站域请求伪造)是一种网络的攻击方式,它在 2007 年曾被列为互联网 20 大安全隐患之一。其余安全隐患,好比 SQL 脚本注入,跨站域脚本攻击等在近年来已经逐渐为众人熟知,不少网站也都针对他们进行了防护。然而,对于大多数人来讲,CSRF 却依然是一个陌生的概念。即使是大名鼎鼎的 Gmail, 在 2007 年末也存在着 CSRF 漏洞,从而被黑客攻击而使 Gmail 的用户形成巨大的损失。html5
CSRF 攻击能够在受害者绝不知情的状况下以受害者名义伪造请求发送给受攻击站点,从而在并未受权的状况下执行在权限保护之下的操做。好比说,受害者 Bob 在银行有一笔存款,经过对银行的网站发送请求 http://bank.example/withdraw?account=bob&amount=1000000&for=bob2 可使 Bob 把 1000000 的存款转到 bob2 的帐号下。一般状况下,该请求发送到网站后,服务器会先验证该请求是否来自一个合法的 session,而且该 session 的用户 Bob 已经成功登录。黑客 Mallory 本身在该银行也有帐户,他知道上文中的 URL 能够把钱进行转账操做。Mallory 能够本身发送一个请求给银行:http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory。可是这个请求来自 Mallory 而非 Bob,他不能经过安全认证,所以该请求不会起做用。这时,Mallory 想到使用 CSRF 的攻击方式,他先本身作一个网站,在网站中放入以下代码: src=”http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory ”,而且经过广告等诱使 Bob 来访问他的网站。当 Bob 访问该网站时,上述 url 就会从 Bob 的浏览器发向银行,而这个请求会附带 Bob 浏览器中的 cookie 一块儿发向银行服务器。大多数状况下,该请求会失败,由于他要求 Bob 的认证信息。可是,若是 Bob 当时恰巧刚访问他的银行后不久,他的浏览器与银行网站之间的 session 还没有过时,浏览器的 cookie 之中含有 Bob 的认证信息。这时,悲剧发生了,这个 url 请求就会获得响应,钱将从 Bob 的帐号转移到 Mallory 的帐号,而 Bob 当时绝不知情。等之后 Bob 发现帐户钱少了,即便他去银行查询日志,他也只能发现确实有一个来自于他本人的合法请求转移了资金,没有任何被攻击的痕迹。而 Mallory 则能够拿到钱后逍遥法外。程序员
在讨论如何抵御 CSRF 以前,先要明确 CSRF 攻击的对象,也就是要保护的对象。从以上的例子可知,CSRF 攻击是黑客借助受害者的 cookie 骗取服务器的信任,可是黑客并不能拿到 cookie,也看不到 cookie 的内容。另外,对于服务器返回的结果,因为浏览器同源策略的限制,黑客也没法进行解析。所以,黑客没法从返回的结果中获得任何东西,他所能作的就是给服务器发送请求,以执行请求中所描述的命令,在服务器端直接改变数据的值,而非窃取服务器中的数据。因此,咱们要保护的对象是那些能够直接产生数据改变的服务,而对于读取数据的服务,则不须要进行 CSRF 的保护。好比银行系统中转帐的请求会直接改变帐户的金额,会遭到 CSRF 攻击,须要保护。而查询余额是对金额的读取操做,不会改变数据,CSRF 攻击没法解析服务器返回的结果,无需保护。ajax
在业界目前防护 CSRF 攻击主要有三种策略:验证 HTTP Referer 字段;在请求地址中添加 token 并验证;在 HTTP 头中自定义属性并验证。下面就分别对这三种策略进行详细介绍。编程
根据 HTTP 协议,在 HTTP 头中有一个字段叫 Referer,它记录了该 HTTP 请求的来源地址。在一般状况下,访问一个安全受限页面的请求来自于同一个网站,好比须要访问 http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory,用户必须先登录 bank.example,而后经过点击页面上的按钮来触发转帐事件。这时,该转账请求的 Referer 值就会是转帐按钮所在的页面的 URL,一般是以 bank.example 域名开头的地址。而若是黑客要对银行网站实施 CSRF 攻击,他只能在他本身的网站构造请求,当用户经过黑客的网站发送请求到银行时,该请求的 Referer 是指向黑客本身的网站。所以,要防护 CSRF 攻击,银行网站只须要对于每个转帐请求验证其 Referer 值,若是是以 bank.example 开头的域名,则说明该请求是来自银行网站本身的请求,是合法的。若是 Referer 是其余网站的话,则有多是黑客的 CSRF 攻击,拒绝该请求。
这种方法的显而易见的好处就是简单易行,网站的普通开发人员不须要操心 CSRF 的漏洞,只须要在最后给全部安全敏感的请求统一增长一个拦截器来检查 Referer 的值就能够。特别是对于当前现有的系统,不须要改变当前系统的任何已有代码和逻辑,没有风险,很是便捷。
然而,这种方法并不是万无一失。Referer 的值是由浏览器提供的,虽然 HTTP 协议上有明确的要求,可是每一个浏览器对于 Referer 的具体实现可能有差异,并不能保证浏览器自身没有安全漏洞。使用验证 Referer 值的方法,就是把安全性都依赖于第三方(即浏览器)来保障,从理论上来说,这样并不安全。事实上,对于某些浏览器,好比 IE6 或 FF2,目前已经有一些方法能够篡改 Referer 值。若是 bank.example 网站支持 IE6 浏览器,黑客彻底能够把用户浏览器的 Referer 值设为以 bank.example 域名开头的地址,这样就能够经过验证,从而进行 CSRF 攻击。
即使是使用最新的浏览器,黑客没法篡改 Referer 值,这种方法仍然有问题。由于 Referer 值会记录下用户的访问来源,有些用户认为这样会侵犯到他们本身的隐私权,特别是有些组织担忧 Referer 值会把组织内网中的某些信息泄露到外网中。所以,用户本身能够设置浏览器使其在发送请求时再也不提供 Referer。当他们正常访问银行网站时,网站会由于请求没有 Referer 值而认为是 CSRF 攻击,拒绝合法用户的访问。
CSRF 攻击之因此可以成功,是由于黑客能够彻底伪造用户的请求,该请求中全部的用户验证信息都是存在于 cookie 中,所以黑客能够在不知道这些验证信息的状况下直接利用用户本身的 cookie 来经过安全验证。要抵御 CSRF,关键在于在请求中放入黑客所不能伪造的信息,而且该信息不存在于 cookie 之中。能够在 HTTP 请求中以参数的形式加入一个随机产生的 token,并在服务器端创建一个拦截器来验证这个 token,若是请求中没有 token 或者 token 内容不正确,则认为多是 CSRF 攻击而拒绝该请求。
这种方法要比检查 Referer 要安全一些,token 能够在用户登录后产生并放于 session 之中,而后在每次请求时把 token 从 session 中拿出,与请求中的 token 进行比对,但这种方法的难点在于如何把 token 以参数的形式加入请求。对于 GET 请求,token 将附在请求地址以后,这样 URL 就变成 http://url?csrftoken=tokenvalue。 而对于 POST 请求来讲,要在 form 的最后加上 <input type=”hidden” name=”csrftoken” value=”tokenvalue”/>,这样就把 token 以参数的形式加入请求了。可是,在一个网站中,能够接受请求的地方很是多,要对于每个请求都加上 token 是很麻烦的,而且很容易漏掉,一般使用的方法就是在每次页面加载时,使用 javascript 遍历整个 dom 树,对于 dom 中全部的 a 和 form 标签后加入 token。这样能够解决大部分的请求,可是对于在页面加载以后动态生成的 html 代码,这种方法就没有做用,还须要程序员在编码时手动添加 token。
该方法还有一个缺点是难以保证 token 自己的安全。特别是在一些论坛之类支持用户本身发表内容的网站,黑客能够在上面发布本身我的网站的地址。因为系统也会在这个地址后面加上 token,黑客能够在本身的网站上获得这个 token,并立刻就能够发动 CSRF 攻击。为了不这一点,系统能够在添加 token 的时候增长一个判断,若是这个连接是链到本身本站的,就在后面添加 token,若是是通向外网则不加。不过,即便这个 csrftoken 不以参数的形式附加在请求之中,黑客的网站也一样能够经过 Referer 来获得这个 token 值以发动 CSRF 攻击。这也是一些用户喜欢手动关闭浏览器 Referer 功能的缘由。
这种方法也是使用 token 并进行验证,和上一种方法不一样的是,这里并非把 token 以参数的形式置于 HTTP 请求之中,而是把它放到 HTTP 头中自定义的属性里。经过 XMLHttpRequest 这个类,能够一次性给全部该类请求加上 csrftoken 这个 HTTP 头属性,并把 token 值放入其中。这样解决了上种方法在请求中加入 token 的不便,同时,经过 XMLHttpRequest 请求的地址不会被记录到浏览器的地址栏,也不用担忧 token 会透过 Referer 泄露到其余网站中去。
然而这种方法的局限性很是大。XMLHttpRequest 请求一般用于 Ajax 方法中对于页面局部的异步刷新,并不是全部的请求都适合用这个类来发起,并且经过该类请求获得的页面不能被浏览器所记录下,从而进行前进,后退,刷新,收藏等操做,给用户带来不便。另外,对于没有进行 CSRF 防御的遗留系统来讲,要采用这种方法来进行防御,要把全部请求都改成 XMLHttpRequest 请求,这样几乎是要重写整个网站,这代价无疑是不能接受的。
下文将以 Java 为例,对上述三种方法分别用代码进行示例。不管使用何种方法,在服务器端的拦截器必不可少,它将负责检查到来的请求是否符合要求,而后视结果而决定是否继续请求或者丢弃。在 Java 中,拦截器是由 Filter 来实现的。咱们能够编写一个 Filter,并在 web.xml 中对其进行配置,使其对于访问全部须要 CSRF 保护的资源的请求进行拦截。
在 filter 中对请求的 Referer 验证代码以下
// 从 HTTP 头中取得 Referer 值 String referer=request.getHeader("Referer"); // 判断 Referer 是否以 bank.example 开头 if((referer!=null) &&(referer.trim().startsWith(“bank.example”))){ chain.doFilter(request, response); }else{ request.getRequestDispatcher(“error.jsp”).forward(request,response); } |
以上代码先取得 Referer 值,而后进行判断,当其非空并以 bank.example 开头时,则继续请求,不然的话多是 CSRF 攻击,转到 error.jsp 页面。
若是要进一步验证请求中的 token 值,代码以下
HttpServletRequest req = (HttpServletRequest)request; HttpSession s = req.getSession(); // 从 session 中获得 csrftoken 属性 String sToken = (String)s.getAttribute(“csrftoken”); if(sToken == null){ // 产生新的 token 放入 session 中 sToken = generateToken(); s.setAttribute(“csrftoken”,sToken); chain.doFilter(request, response); } else{ // 从 HTTP 头中取得 csrftoken String xhrToken = req.getHeader(“csrftoken”); // 从请求参数中取得 csrftoken String pToken = req.getParameter(“csrftoken”); if(sToken != null && xhrToken != null && sToken.equals(xhrToken)){ chain.doFilter(request, response); }else if(sToken != null && pToken != null && sToken.equals(pToken)){ chain.doFilter(request, response); }else{ request.getRequestDispatcher(“error.jsp”).forward(request,response); } } |
首先判断 session 中有没有 csrftoken,若是没有,则认为是第一次访问,session 是新创建的,这时生成一个新的 token,放于 session 之中,并继续执行请求。若是 session 中已经有 csrftoken,则说明用户已经与服务器之间创建了一个活跃的 session,这时要看这个请求中有没有同时附带这个 token,因为请求可能来自于常规的访问或是 XMLHttpRequest 异步访问,咱们分别尝试从请求中获取 csrftoken 参数以及从 HTTP 头中获取 csrftoken 自定义属性并与 session 中的值进行比较,只要有一个地方带有有效 token,就断定请求合法,能够继续执行,不然就转到错误页面。生成 token 有不少种方法,任何的随机算法均可以使用,Java 的 UUID 类也是一个不错的选择。
除了在服务器端利用 filter 来验证 token 的值之外,咱们还须要在客户端给每一个请求附加上这个 token,这是利用 js 来给 html 中的连接和表单请求地址附加 csrftoken 代码,其中已定义 token 为全局变量,其值能够从 session 中获得。
function appendToken(){ updateForms(); updateTags(); } function updateForms() { // 获得页面中全部的 form 元素 var forms = document.getElementsByTagName('form'); for(i=0; i<forms.length; i++) { var url = forms[i].action; // 若是这个 form 的 action 值为空,则不附加 csrftoken if(url == null || url == "" ) continue; // 动态生成 input 元素,加入到 form 以后 var e = document.createElement("input"); e.name = "csrftoken"; e.value = token; e.type="hidden"; forms[i].appendChild(e); } } function updateTags() { var all = document.getElementsByTagName('a'); var len = all.length; // 遍历全部 a 元素 for(var i=0; i<len; i++) { var e = all[i]; updateTag(e, 'href', token); } } function updateTag(element, attr, token) { var location = element.getAttribute(attr); if(location != null && location != '' '' ) { var fragmentIndex = location.indexOf('#'); var fragment = null; if(fragmentIndex != -1){ //url 中含有只至关页的锚标记 fragment = location.substring(fragmentIndex); location = location.substring(0,fragmentIndex); } var index = location.indexOf('?'); if(index != -1) { //url 中已含有其余参数 location = location + '&csrftoken=' + token; } else { //url 中没有其余参数 location = location + '?csrftoken=' + token; } if(fragment != null){ location += fragment; } element.setAttribute(attr, location); } } |
在客户端 html 中,主要是有两个地方须要加上 token,一个是表单 form,另外一个就是连接 a。这段代码首先遍历全部的 form,在 form 最后添加一隐藏字段,把 csrftoken 放入其中。而后,代码遍历全部的连接标记 a,在其 href 属性中加入 csrftoken 参数。注意对于 a.href 来讲,可能该属性已经有参数,或者有锚标记。所以须要分状况讨论,以不一样的格式把 csrftoken 加入其中。
若是你的网站使用 XMLHttpRequest,那么还须要在 HTTP 头中自定义 csrftoken 属性,利用 dojo.xhr 给 XMLHttpRequest 加上自定义属性代码以下:
var plainXhr = dojo.xhr; // 重写 dojo.xhr 方法 dojo.xhr = function(method,args,hasBody) { // 确保 header 对象存在 args.headers = args.header || {}; tokenValue = '<%=request.getSession(false).getAttribute("csrftoken")%>'; var token = dojo.getObject("tokenValue"); // 把 csrftoken 属性放到头中 args.headers["csrftoken"] = (token) ? token : " "; return plainXhr(method,args,hasBody); }; |
这里改写了 dojo.xhr 的方法,首先确保 dojo.xhr 中存在 HTTP 头,而后在 args.headers 中添加 csrftoken 字段,并把 token 值从 session 里拿出放入字段中。
经过上文讨论可知,目前业界应对 CSRF 攻击有一些克制方法,可是每种方法都有利弊,没有一种方法是完美的。如何选择合适的方法很是重要。若是网站是一个现有系统,想要在最短期内得到必定程度的 CSRF 的保护,那么验证 Referer 的方法是最方便的,要想增长安全性的话,能够选择不支持低版本浏览器,毕竟就目前来讲,IE7+, FF3+ 这类高版本浏览器的 Referer 值还没法被篡改。
若是系统必须支持 IE6,而且仍然须要高安全性。那么就要使用 token 来进行验证,在大部分状况下,使用 XmlHttpRequest 并不合适,token 只能以参数的形式放于请求之中,若你的系统不支持用户本身发布信息,那这种程度的防御已经足够,不然的话,你仍然难以防范 token 被黑客窃取并发动攻击。在这种状况下,你须要当心规划你网站提供的各类服务,从中间找出那些容许用户本身发布信息的部分,把它们与其余服务分开,使用不一样的 token 进行保护,这样能够有效抵御黑客对于你关键服务的攻击,把危害降到最低。毕竟,删除别人一个帖子比直接从别人帐号中转走大笔存款严重程度要轻的多。
若是是开发一个全新的系统,则抵御 CSRF 的选择要大得多。笔者建议对于重要的服务,能够尽可能使用 XMLHttpRequest 来访问,这样增长 token 要容易不少。另外尽可能避免在 js 代码中使用复杂逻辑来构造常规的同步请求来访问须要 CSRF 保护的资源,好比 window.location 和 document.createElement(“a”) 之类,这样也能够减小在附加 token 时产生的没必要要的麻烦。
最后,要记住 CSRF 不是黑客惟一的攻击手段,不管你 CSRF 防范有多么严密,若是你系统有其余安全漏洞,好比跨站域脚本攻击 XSS,那么黑客就能够绕过你的安全防御,展开包括 CSRF 在内的各类攻击,你的防线将如同虚设。
可见,CSRF 是一种危害很是大的攻击,又很难以防范。目前几种防护策略虽然能够很大程度上抵御 CSRF 的攻击,但并无一种完美的解决方案。一些新的方案正在研究之中,好比对于每次请求都使用不一样的动态口令,把 Referer 和 token 方案结合起来,甚至尝试修改 HTTP 规范,可是这些新的方案尚不成熟,要正式投入使用并被业界广为接受还需时日。在这以前,咱们只有充分重视 CSRF,根据系统的实际状况选择最合适的策略,这样才能把 CSRF 的危害降到最低。
学习