1. 问题的引出javascript
在Restful的服务设计中,查询某些信息的时候,通常的URL地址设计为: get /basic/service? keyword=历史 , 之类的URL地址。 可是,在实际的开发和使用中,确是有乱码状况的发生,在后台的读取keyword信息为乱码,没法正确读取。前端
2. 乱码是如何产生的?java
因为咱们利用URL传递参数这种方式是依赖与浏览器环境中的,也就是说URL及URL中包含的各个key=value格式的传递参数键值对参数是在浏览器地址栏中的处理原理处理相应编码后传递至后台进行解码的。
因为咱们没有进行任何处理,此时javascript请求URL并传参数存在中文时(也就是说输入框中输入中文时),对URL的中文参数进行编码是按照浏览器机制进行编码的。此时编码存在乱码问题。
3. 初次编码, javascript中利用encodeURI()方法进行编码。
利用encodeURI()在javascript中对中文URL参数进行编码时,“测试”二字会被转换为“%E6%B5%8B%E8%AF%95”。 可是问题依然存在。缘由是在编码后的字符串信息,浏览器机制会认为“%”是一个转义字符,浏览器会把地址栏URL中的传递的已转换参数“%”与“%”之间的已转义字符进行处理传递到后台中。这样会形成与实际通过encodeURI()编码后的URL不符,由于浏览器误认为“%”是转义字符字符了,它并未将“%”认为是个普通字符。
4. 二次编码,使用encodeURI
操做: encodeURI(encodeURI("/order?name=" + name));
处理后的URL不在是经过一次 encodeURI()转换后的字符串”%E6%B5%8B%E8%AF%95“,而是通过上一步两层encodeURI()处理URL处理后的字符串”%25E6%B255%258B%25E8%AF%2595“,经过再次编码原有被浏览起解析为转义字符的”%“被再次编码,转换成了普通字符转”%25“。
此时前端javascript代码对带有中文的URL编码已经完成,并经过URL传递参数的方式传递到后台等待处理,Action获取到正常转换切无乱码的参数为”%25E6%B255%258B%25E8%AF%2595“,此字符串对应的中文正是咱们输入的”测试“二字。
5. 后台如何正确解析中文字符信息?
进入后台的信息,在通过二次encodeURI()以后,直接读取是没法后去正确的信息的。 须要继续以下处理:ajax
URLDecoder.decode("chinese string","UTF-8") 复制代码
URLDecoder的decode(String str,String ecn)方法有两个参数,第一个参数为待解码的字符串,第二个参数为解码时的对应编码。浏览器
6. encodeURI, encodeURIComponent, escapebash
6.1 escape()函数
escape() 函数可对字符串进行编码,这样就能够在全部的计算机上读取该字符串。
返回值:已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。
说明 :该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其余全部的字符都会被转义序列替换。全部的空格符、标点符号、特殊字符以及其余非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符在字符集表里面的编码的16进制数字)。好比,空格符对应的编码是%20。不会被此方法编码的字符: @ * / +
6.2 encodeURI() 方法
把URI字符串采用UTF-8编码格式转化成escape格式的字符串。不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + '
6.3 encodeURIComponent() 方法
把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,好比 / 等字符。因此若是字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,不然 / 字符被编码以后URL将显示错误。
不会被此方法编码的字符:! * ( ) '
所以,对于中文字符串来讲,若是不但愿把字符串编码格式转化成UTF-8格式的(好比原页面和目标页面的charset是一致的时候),只须要使用escape。若是你的页面是GB2312或者其余的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。服务器
说了这么多,我经常使用的是下面的方案:函数
7. 另外一种处理URL的中文乱码方案(推荐使用)测试
请求端的中字符有encodeURI进行一次转码,如:
var url="/ajax?name="+encodeURI(name);
服务器端代码:
name=new String(name.getBytes("iso8859-1"),"UTF-8");
注: name为得到的字符串,iso8859-1为项目的默认字符编码,若是为中文编码gbk,gb2312等则不用这一步进行处理.编码
分析: 通过程序验证,结果可行的。 由此可知,浏览器自己默认的编码方式是iso8859-1的方式,即便使用了encodeURI进行了utf-8编码处理,主要的字符串内容,好比ascii字符和可见字符都仍是基于iso8859-1浏览器自身的字符。缘由就是这些字符在编码上和UTF-8字符串是重合的。而encodeURI之类的转义函数主要解决,特殊字符%,/之类的字符的转义问题。