HTML 中文乱码

时间 2020-04-18

标签 html 中文乱码栏目 HTML 繁體版

原文原文链接

在网页中，中文乱码的问题时常出现。之前我遇到乱码问题时，就是不停的尝试不一样的编码方式，直到成功。昨天项目又遇到了这个问题，我因而作了简单的测试。html

html文件是有编码方式的，好比"UTF-8"、"GBK"等等。这些在记事本中或许看不出来，可是在eclipse中，能够设置html文件的编码方式，如下的图片中会有说明。浏览器

测试一：eclipse

以"UTF-8"方式保存html文件，具体的文件内容见下图：编辑器

图中能够看到，文件的编码方式为"UTF-8"，下方的红框中的Other所示，是在eclipse中设置的。图片上方的红框指明浏览器打开该文件的编码方式，能够看到为"UTF-8"。测试

使用IE打开该文件，能够看到下图：编码

查看浏览器的编码方式，能够看到浏览器自动选择了"UTF-8"方式，而且没有出现乱码。spa

切换浏览器的编码方式到"GB2312"，能够看到下图：htm

测试二：图片

以"UTF-8"方式保存html文件，并设置文件头中的编码方式为"GBK"，以下图：ip

这代表：文件的编码方式为"UTF-8"，默认的文件打开方式为"GBK"。

使用IE打开这个文件的截图以下：

能够看到浏览器根据html文件的指示，用"GB2312"方式来打开。因为文件自己的编码方式是"UTF-8"，因此出现了乱码。可是网页源文件并非乱码。

选择浏览器的编码方式为"UTF-8"，能够看到乱码现象消失。截图以下：

至此，测试结束。概括如下几点：

1. html文件是有编码格式的，这个在特定的编辑器中才能看出来，并进行设置。

2. html文件中头部的"content-type"中设置的"charset"是告诉浏览器打开该文件的编码方式。

3. 通常一、2点中的编码方式应该一致，不一致可能出现乱码。

4. 若是浏览器中显示乱码，可是页面源文件不是乱码，能够经过修改浏览器的编码方式看到正确的中文，若是在源文件中设置了正确的"charset"，就不须要修改浏览器的编码方式了。