JS系列之url编码

ASCII 字符

ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其余西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。安全

如下是部分ASCII码对照表:
图片描述函数

为何须要对URI进行编码

对于Url来讲,之因此要进行编码,是由于Url中有些字符会引发歧义。编码

Javascript中提供了3对函数用来对Url编码以获得合法的Url:url

  1. escape --> unescape
  2. encodeURI --> decodeURI
  3. encodeURIComponent --> decodeURIComponent

下面的表格列出了这三个函数的安全字符(即函数不会对这些字符进行编码):
图片描述spa

escape --> unescape

  • 不对 ASCII 字母、数字进行编码
  • 不对 *@-_+./ 进行编码
  • 其余全部的字符都会被转义序列替换

这个方法属于过期产物,ECMAScript v3 反对使用该方法,应用使用 encodeURI() 和 encodeURIComponent() 替代它。code

encodeURI --> decodeURI

  • 不对 ASCII 字母和数字进行编码。
  • 不对 -_.!~*'();/?:@&=+$,# 这20个ASCII 标点符号进行编码。
  • 其余全部的字符都会被转义序列替换

encodeURIComponent --> decodeURIComponent

它跟encodeURI的区别就是,encodeURI是对整个url进行编码,而encodeURIComponent是对url的个别部分进行编码。
若是 URI 组件中含有分隔符,好比 ? 和 #,则应当使用 encodeURIComponent() 方法分别对各组件进行编码orm

encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1');
// http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1
相关文章
相关标签/搜索