URL编码与解码

时间 2019-12-01

标签 url 编码解码栏目 HTTP/TCP 繁體版

原文原文链接

在项目中碰到了ajax传来的参数，后台接收值乱码（以下图）的问题在此记录一下

前台：javascript

后台：html

解决问题

为何须要编码
怎样编码
实际出现的问题解决方法

1.为何须要编码？

URL 只能使用 ASCII 字符集来经过因特网进行发送。 也就是说URL只能使用英文字母、阿拉伯数字和某些标点符号，不能使用其余文字和符号

这意味着若是URL中有汉字，就必须编码后使用。 java

可是麻烦的是标准的国际组织并无规定具体的编码方法，而是交给应用程序（浏览器）本身决定。 jquery

这致使"URL编码"成为了一个混乱的领域。 web

1.1 浏览器对于中文的编码

Chrome浏览器和火狐的浏览器是同样的以下图，"文"和"章"的utf-8编码分别是"E6 96 87"和"E7 AB A0" ,ajax

下图所示的"%e6%96%87%e7%ab%a0"就是按照顺序，在每一个字节前加上%而获得的chrome

Edge浏览器和IE浏览器是同样的，以下图这个的编码方式我没看出来,但愿高手指点json

1.2 须要编码的缘由还有几点：

你有没有想过，Ukey=value这种传参方式式中， Value中包含 ?或者 = 怎么办呢

你有没有想过，不一样的操做系统、浏览器、不一样的网页字符集（charset）会对你的传值形成影响呢

若是你都考虑过，毫无疑问你早就知道须要编码的缘由了浏览器

2.怎样编码？

Url编码一般也被称为百分号编码（percent-encoding），是由于它的编码方式很是简单，

使用%百分号加上两位的字符——0123456789ABCDEF——表明一个字节的十六进制形式

对于ASCII字符，字母a 在ASCII码中对应的字节是0x61，那么Url编码以后获得的就是%61，

字母abc， url编码后获得的就是%61%62%63

对于非ASCII字符，RFC文档建议使用utf-8对其进行编码获得相应的字节，而后对每一个字节执行百分号编码。

如"中文"使用UTF-8字符集获得的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87，通过Url编码以后获得"%E4%B8%AD%E6%96%87"。

使用Javascript先对URL编码，而后再向服务器提交，不要给浏览器插手的机会 这样就能保证客户端只用一种编码方法向服务器发出请求

3.实际出现的问题解决方法

首先说一下js的三种编码函数，escape、encodeURI和encodeURIComponent

3.1.escape函数：

js中编码出生最先的一个，不提倡使用，缘由是它不符合我上边(【怎样】)说的url编码原则服务器

真正做用是:

返回一个字符的Unicode编码值，为的是方便他们能在全部计算机上可读

具体规则是:

全部空格、标点以及其余非ASCII字符都用%xx编码替换; 例如空格返回的是%20 字符值大于255的字符以%uxxxx格式储存

因此之后若是看到%u的编码，那就是escape函数

看下边这个列子你就很清楚的知道它的具体转换规则了

项目中使用：

前台：

function HandlerAddress() {
            $.ajax({
                type: "get",
                //用的是js的escape方法
                url: "handler/Handler.ashx?address=" + escape("朝阳区大屯路东"),
                contentType: "application/json; charset=utf-8",
                success: function (data) {
                //todo成功方法
                },
                error: function (XMLhttpRequest, textStatus, errorThrown) {
                //todo失败方法
                }
            })

后台：

QueryString 这个函数会自动解码，因此不须要写什么解码的语句。

还有一点须要注意的是：

escape()不对"+"编码。可是咱们知道，网页在提交表单的时候，若是有空格，则会被转化为+字符。服务器处理数据的时候，会把+号处理成空格。因此，使用的时候要当心。

3.2.encodeURI函数

这个函数才是javascript中真正用来对URL编码的函数

规则就是我上面第二部分所说的，采用utf-8编码。

前台：

后台：

用这个方法会存在乱码的问题，看到不少人问这问题的时候，回答者都是让采用escape这种方法，难道这样问题就解决了吗？

若是我想用Jquery的serialize()方法来获取表单值而且序列化(标准URL编码)传到后台就不方便用escape啦

解决乱码问题：

出现乱码的缘由是个人web config文件里有这样的配置：

<globalization requestEncoding="gb2312" responseEncoding="gb2312" />

解决方案1：去掉这个设置或者改为utf-8的(这个方案的利害不用说，尤为是在项目已经快完成的时候)

解决方案2：利用ajax的post方法，或者用Get方法，但必须做为方法的Data参数，这样在后台接收到的数据不会被编码

前台：

$.ajax({
                type: "get",
                //用的是js的encodeURI方法
                url: "handler/Handler.ashx",
                //做为Data参数
                data: { address: encodeURI("朝阳区大屯路东") },

                contentType: "application/json; charset=utf-8",
                success: function (data) {
                //todo成功方法
                },
                error: function (XMLhttpRequest, textStatus, errorThrown) {
                //todo失败方法
                }
            })

后台：须要手动解码一次

string ad =HttpUtility.UrlDecode(context.Request["address"]);

HttpUtility.UrlDecode和Server.UrlDecode不一样的是，HttpUtility.UrlDecode是有重载的，能够指定编码的方式

例如：

string adsx = HttpUtility.UrlDecode(context.Request.QueryString["address"],System.Text.Encoding.UTF8);

解决方案3：获取已编码的原始数据，本身进行解码

经过观察Request的对象，能够发现context.Request.Url.Query是未解码的数据，这就太棒了

代码：

string address= HttpUtility.ParseQueryString(context.Request.Url.Query, Encoding.UTF8)["address"];

解决方案4(探讨)：先将QueryString解码的数据按照他原来的方式进行编码，而后再用utf8进行解码，这个方法有点问题，最后一个字符会出现乱码，还没找到缘由..

在将数据编码的时候，就不是原来的浏览器发送的编码值了，正确的是最后边应该是%9C，但如今倒是%3f

3.3.encodeURIComponent函数

与encodeURI()的区别是，它用于对URL的组成部分进行个别编码，而不用于对整个URL进行编码。

所以，"; / ? : @ & = + $ , #"，这些在encodeURI()中不被编码的符号，在encodeURIComponent()中通通会被编码

具体的编码规则是和encodeURI函数是同样的，以下，encodeURI不会编码 ? 和 @,而encodeURIComponent会

encodeURIComponent这个函数就和他的名字同样，是对URI中的一个组件进行编码，不能用于所有的URI

初次写文章，若是有错误或者表达的不清楚，尽管提出来，吐槽黑我均可以反正我脸皮厚

参考：阮一峰-关于URL编码

1. javascript URL 编码与解码
2. URL编码与解码
3. url 编码、解码
4. URL编解码
5. javascript实现URL编码与解码
6. JAVA 对 URL 进行编码与解码
7. RFC3986之URL编码与解码、AFPercentEscapedStringFromString
8. java url编码解码
9. Java URL编码解码
10. url编码和解码
更多相关文章...
• XML 编码 - XML 教程
• HTTP状态码 - HTTP 教程
• Scala 中文乱码解决
• IntelliJ IDEA代码格式化设置

URL编码与解码

在项目中碰到了ajax传来的参数，后台接收值乱码（以下图）的问题 在此记录一下

解决问题

1.为何须要编码？

1.1 浏览器对于中文的编码

1.2 须要编码的缘由还有几点：

你有没有想过，Ukey=value这种传参方式式中， Value中包含 ?或者 = 怎么办呢

你有没有想过，不一样的操做系统、浏览器、不一样的网页字符集（charset）会对你的传值形成影响呢

2.怎样编码？

Url编码一般也被称为百分号编码（percent-encoding），是由于它的编码方式很是简单，

使用%百分号加上两位的字符——0123456789ABCDEF——表明一个字节的十六进制形式

对于ASCII字符，字母a 在ASCII码中对应的字节是0x61，那么Url编码以后获得的就是%61，

字母abc， url编码后获得的就是%61%62%63

对于非ASCII字符，RFC文档建议使用utf-8对其进行编码获得相应的字节，而后对每一个字节执行百分号编码。

如"中文"使用UTF-8字符集获得的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87，通过Url编码以后获得"%E4%B8%AD%E6%96%87"。