URLEncode

为何请求时,须要使用URLEncode作encode转码操做?

发现如今几乎全部的网站都对url中的汉字和特殊的字符,进行了urlencode操做, 也就是:apache

http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/blog/安全

这个样子,中间%形式的,确定就是个人登陆用户名称了吧。服务器

为何对这些字符进行了u的编码形式,是为了字符编码(gbk、utf8)仍是为了避免出现特殊的字符在url中?都知道要转,可是转了的真正好处呢。查看了网上的不少资料,也没有找到更加准确的说法。app

url转义其实也只是为了符合url的规范而已。由于在标准的url规范中中文和不少的字符是不容许出如今url中的。网站

那哪些字符是须要转化的呢?编码

  1. ASCII 的控制字符url

这些字符都是不可打印的,天然须要进行转化。spa

  1. 一些非ASCII字符.net

这些字符天然是非法的字符范围。转化也是理所固然的了。code

  1. 一些保留字符

很明显最多见的就是“&”了,这个若是出如今url中了,那你认为是url中的一个字符呢,仍是特殊的参数分割用的呢?

  1. 就是一些不安全的字符了。

例如:空格。为了防止引发歧义,须要被转化为“+”。

明白了这些,也就知道了为何须要转化了,而转化的规则也是很简单的。

按照每一个字符对应的字符编码,不是符合咱们范围的,通通的转化为%的形式也就是了。天然也是16进制的形式。

和字符编码无关

经过urlencode的转化规则和目的,咱们也很容易的看出,urleocode是基于字符编码的。一样的一个汉字,不一样的编码类型,确定对应不一样的urleocode的串。gbk编码的有gbk的encode结果。

apache等服务器,接受到字符串后,能够进行decode,可是仍是没法解决编码的问题。编码问题,仍是须要靠约定或者字符编码的判断解决。

所以,urleocode只是为了url中一些非ascii字符,能够正确无误的被传输,至于使用哪一种编码,就不是eocode所关心和解决的问题了。

 

详细http://www.javashuo.com/article/p-hssgmisr-hk.html

Java中转化

URLEncode和URLDecode用于完成普通字符串和 application/x-www-from-urlencoded MIME字符串之间的相互转化

若是传递的字符串中包含非西欧字符的字符串,会被转化成%XX%XX XX为十六进制的数字

try { // 将application/x-www-from-urlencoded字符串转换成普通字符串 
            String keyWord = URLDecoder.decode("%C4%E3%BA%C3", "GBK"); System.out.println(keyWord); //输出你好 // 将普通字符创转换成application/x-www-from-urlencoded字符串 
            String urlString = URLEncoder.encode("你好", "GBK");  //输出%C4%E3%BA%C3
 System.out.println(urlString); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block
 e.printStackTrace(); } 
相关文章
相关标签/搜索