web安全防范之XSS漏洞***

时间 2021-08-14

标签 javascript html 前端 java node web express 安全 markdown session 栏目 HTML 繁體版

原文原文链接

web 安全防范之XSS漏洞***

最近在 cnode社区，由@吴中骅的一篇关于XSS的文章，直接致使了社区的人开始在cnode尝试各类***。本文总结了一下此次碰到的一些问题与解决方案。

文件上传漏洞

以前 nodeclub在上传图片的时候逻辑是这样的：

1. //用户上传的文件名

2. var filename = Date.now() + '_' + file.name;

3. //用户文件夹

4. var userDir = path.join(config.upload_dir, uid);

5. //最终文件保存的路径

6. var savepath = path.join(userDir, filename);

7. //将用户上传的文件从临时目录移动到最终保存路径

8. fs.rename(file.path, savepath, callback);

看上去好像没有问题，每一个人上传的文件都存放在以用户 UID命名的一个文件夹内，而且以当前的时间戳做前缀。可是当有用户恶意构造输入的时候，问题就出现了。当用户上传的文件filename为/../../xxx的时候，上传的文件就会rename到用户文件夹以外，致使用户能够替换现有系统上的任何文件。

这个漏洞相对来讲很是的低级，可是后果倒是最严重的，直接致使整个系统均可能被用户控制。修复的方法也很简单：

1. var filename = Date.now() + '_' + file.name;

3. var userDir = path.join(config.upload_dir, uid);

5. //获取最终保存到的绝对路径

6. var savepath = path.resolve(path.join(userDir, filename));

7. //验证

8. if (savepath.indexOf(path.resolve(userDir)) !== 0) {

9. return res.send({status: 'forbidden'});

10.}

11.fs.rename(file.path, savepath, callback);

12.

富文本编辑器的XSS

关于 XSS，在@吴中骅的文章中已经很是详细的描述了。而cnode社区中，用户发表话题和回复话题也是用的一个支持markdown格式的富文本编辑器。以前是没有作过任何XSS防范措施的，因而...你能够直接在里面写：

1. <script>alert(123); </script>

2. <div onmouseover="alert(123)" ></div>

3. <a href="alert(123);" >123 </a>

而 markdown格式的内容也没有作URL有效性检测，因而各类样式的XSS又出来了：

[xss][1]

[xss][2]

![xss][3]

[1]: alert(123);< /div>

[2]: http://www.baidu.com/#"onclick='alert(123)'

[3]: http://www.baidu.com/img.jpg#"onmouseover='alert(123)'

在社区这个应用场景下，引入 HTML标签只是为了进行一些排版的操做，而其余的样式定义等等都只会让整个界面一团糟，更别说还有潜在的XSS漏洞风险。所以，其实咱们是不须要支持用户输入HTML标签来进行内容排版的，一切均可以经过markdown来代替。而后经过简单粗暴的HTML escape，就能够消灭掉直接输入HTML致使的XSS风险。

1. function escape(html) {

2. return html.replace(/&(?!\w+;)/g, '&')

3. .replace(/ </g, ' <')

4. .replace( />/g, ' >')

5. .replace(/"/g, '"');

6. }

然而这样粗暴的进行 escape，会致使用户输入的代码里面的< > ;这些特殊字符也被转义掉，不能正确显示，须要先将代码段提取出来保存，只转义非代码段的部分。因而这个escape函数变成了这样：

1. function escape(html) {

2. var codeSpan = /(^|[^\\])(`+)([^\r]*?[^`])\2(?!`)/gm;

3. var codeBlock = /(?:\n\n|^)((?:(?:[ ]{4}|\t).*\n+)+)(\n*[ ]{0,3}[^ \t\n]|(?=~0))/g;

4. var spans = [];

5. var blocks = [];

6. var text = String(html).replace(/\r\n/g, '\n')

7. .replace('/\r/g', '\n');

8. text = '\n\n' + text + '\n\n';

9. texttext = text.replace(codeSpan, function(code) {

10.spans.push(code);

11.return '`span`';

12.});

13.text += '~0';

14.return text.replace(codeBlock, function (whole, code, nextChar) {

15.blocks.push(code);

16.return '\n\tblock' + nextChar;

17.})

18..replace(/&(?!\w+;)/g, '&')

19..replace(/ </g, ' <')

20..replace( />/g, ' >')

21..replace(/"/g, '"')

22..replace(/`span`/g, function() {

23.return spans.shift();

24.})

25..replace(/\n\tblock/g, function() {

26.return blocks.shift();

27.})

28..replace(/~0$/,'')

29..replace(/^\n\n/, '')

30..replace(/\n\n$/, '');

31.};

32.

而对于 markdown生成的<a>标签和<img>标签中的href属性，必需要作URL有效性检测或者作xss的过滤。这样保证经过markdown生成的HTML代码也是没有XSS漏洞的。

由于 XSS的手段确实比较多，见XSS Filter Evasion Cheat Sheet。所以可以作粗暴的HTML escape是最安全的，可是并非每个地方均可以经过markdown来代替HTML代码，因此不是每个地方都能用HTML escape，这个时候就须要其余的手段来过滤XSS漏洞了。

XSS防范只能经过定义白名单的形式，例如只容许 <p> <div> <a>标签，只容许href class style属性。而后对每个可能形成XSS的属性进行特定的过滤。

现有的 XSS过滤模块，一个是node-validator, 一个是@雷宗民写的js-xss。

不可以保证 XSS模块能够防范住任意的XSS***，可是起码可以过滤掉大部分可以想象到的漏洞。node-validator的XSS()仍然有bug，对于<p on="></p>形式的代码，会有双引号不闭合的问题，致使HTML元素测漏。

模版引擎致使的XSS***

cnode社区采用的是 ejs做为模版引擎，而在ejs中，提供了两种输出动态数据到页面的方法：

<% =data %> //进行 xss过滤的输出

<% -data %> //不过滤直接输出

而全部的过滤必须有一个前提：模版文件中的 HTML属性的值等，必须使用双引号。例如：

1. <img src='<%= reply.author.avatar_url %>' title='<%= reply.author.name %>' />

2. <img src="<%= reply.author.avatar_url %>" title="<%= reply.author.name %>" />

上面两条语句，第一句因为使用的是单引号，用户能够经过构造一个 avatar_url中带单引号，来截断src属性，后面就能够随意加javascript代码了。

CSRF ***

CSRF***在 node的web开发框架connect和express等中都有了解决方方案。经过在访客的session中存放一个随机的_csrf字段，模版引擎在生成HTML文件的时候将这个_csrf值传递到前端，访客提交的任意POST请求，都必须带上这个字段进行验证，保证了只有当前用户在当前页面上能够进行修改的操做。

然而当页面存在 XSS漏洞的时候，CSRF的这种防范措施就成了浮云。恶意***者彻底能够经过javascript代码，获取到其余用户的_csrf值，并直接模拟用户的POST请求进行服务端数据的更改。