【META http-equiv="Content-Type" Content="text/html; Charset=*】意义详解

时间 2019-12-11

标签 meta http equiv content type text html charset 意义详解栏目 HTML5 繁體版

原文原文链接

【META http-equiv="Content-Type" Content="text/html; Charset=*】意义详解

META，网页Html语言里Head区重要标签之一
HTTP-EQUIV相似于HTTP的头部协议，它回应给浏览器一些有用的信息，以帮助正确和精确地显示网页内容。经常使用的HTTP- EQUIV类型有：

Content-Type和Content-Language (显示字符集的设定)
说明：设定页面使用的字符集，用以说明主页制做所使用的文字已经语言，浏览器会根据此来调用相应的符集显示page内容。
< Meta http-equiv=" Content-Type" Content=" text/html; Charset=gb2312">该 META标签订义了HTML页面所使用的字符集为GB2132，就是国标汉字码。若是将其中的“charset=GB2312”替换成“BIG5”，则该页面所用的字符集就是繁体中文Big5码。当你浏览一些国外的站点时，IE浏览器会提示你要正确显示该页面须要下载xx语支持。这个功能就是经过读取HTML页面 META标签的 Content-Type属性而得知须要使用哪一种字符集显示该页面的。若是系统里没有装相应的字符集，则IE就提示下载。其余的语言也对应不一样的charset，好比日文的字符集是“iso-2022-jp ”，韩文的是“ks_c_5601”。
Content-Type的 Content还能够是： text/xml等文档类型Charset选项：ISO-8859-1(英文)、BIG五、UTF-八、SHIFT-Jis、Euc、Koi8-二、us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp,euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw, x-cns11643-1,x-cns11643-2等字符集；Content-Language的 Content还能够是：EN、FR等语言代码。字符集与编码各个国家和地区所制定的不一样 ANSI 编码标准中，都只规定了各自语言所需的“字符”。好比：汉字标准（GB2312）中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义： 1. 使用哪些字符。也就是说哪些汉字，字母和符号会被收入标准中。所包含“字符”的集合就叫作“字符集”。 2. 规定每一个“字符”分别用一个字节仍是多个字节存储，用哪些字节来存储，这个规定就叫作“编码”。各个国家和地区在制定编码标准的时候，“字符的集合”和“编码”通常都是同时制定的。所以，日常咱们所说的“字符集”，好比：GB2312, GBK, JIS 等，除了有“字符的集合”这层含义外，同时也包含了“编码”的含义。 “UNICODE 字符集”包含了各类语言中使用到的全部“字符”。用来给 UNICODE 字符集编码的标准有不少种，好比：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。一、ISO-8859-1：最简单的编码规则，每个字节直接做为一个 UNICODE 字符。好比，[0xD6, 0xD0] 这两个字节，经过 iso-8859-1 转化为字符串时，将直接获得 [0x00D6, 0x00D0] 两个 UNICODE 字符，即 "ÖÐ"。反之，将 UNICODE 字符串经过 iso-8859-1 转化为字节串时，只能正常转化 0~255 范围的字符。二、GB2312,BIG5,Shift_JIS,ISO-8859-2 把 UNICODE 字符串经过 ANSI 编码转化为“字节串”时，根据各自编码的规定，一个 UNICODE 字符可能转化成一个字节或多个字节。反之，将字节串转化成字符串时，也可能多个字节转化成一个字符。好比，[0xD6, 0xD0] 这两个字节，经过 GB2312 转化为字符串时，将获得 [0x4E2D] 一个字符，即 '中' 字。 “ANSI 编码”的特色： 1. 这些“ANSI 编码标准”都只能处理各自语言范围以内的 UNICODE 字符。 2. “UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。三、UTF-8,UTF-16,UnicodeBig 与“ANSI 编码”相似的，把字符串经过 UNICODE 编码转化成“字节串”时，一个 UNICODE 字符可能转化成一个字节或多个字节。与“ANSI 编码”不一样的是：