Java Web 编码问题一:jsp的编码问题

首先咱们来看一张由eclipse生成的jsp文件的头:html

图1:JSP文件编码
java

如上图所示jsp中的三个编码,浏览器

  1. ①表明的是服务器响应客户端请求的编码方式。服务器会用它来设置http响应头的content-type。就比如在Servlet中用response.setContentType("text/html;charset=utf-8")的做用。能够在浏览器的Header中响应头中的Content-Type中看到。服务器

  2.  ②pageEnconding的编码是值jsp文件自己被编码的编码格式。由于jsp最终会被编译成clss的字节码,而字节码是Unicode编码的,因此必须知道格式才能转换。若是没有设置,eclipse会按iso-8859-1的编码方式对其编码。若是1没有设置,那么就会使用2pageEncoding的编码来设置。eclipse

  3. ③中的content也是设置浏览器的解码格式的,可是它的优先级没有Header中的Content-Type优先级高,因此只要在Header中设置了Content-Type,那么就基本不会使用meta中的content了。jsp

下面经过一个很是简单的例子来测试一下:测试

<%@ page language="java" contentType="text/html; charset=utf-8"
    pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>encoding</title>
</head>
<body>
<center>
<h4>您好!</h4> 
</center>
</body>
</html>

很是简单,运行没有乱码。用Firefox的debug看一下请求头以下:ui

图2:Header1
编码

若是您有兴趣,能够尝试着把图1中①的编码contentType去掉,发现仍是没有乱码,查看响应头信息,Content-Type的编码依然是utf-8,这是由于若是没有设置图1中①的编码contentType默认使用的就是图1中②pageEncoding的编码方式。spa

       还能够尝试着把③中的编码改成iso-8859-1之类的与中文不兼容的编码,发现仍然没有乱码,查看请求头信息Content-Type的编码依然是utf-8,而且比meta中编码的优先级高因此浏览器仍是使用响应头中的utf-8的方式来解码。

        如今咱们把中①的编码contentType编码改成GBK,以下图:


图3:contentType-GBK

        在Firefox debug中查看请求头信息Content-Type的编码,发现Content-Type的编码是GBK这样证实①的编码contentType是设置响应头中的Content_Type。可是奇怪的是并无产生乱码,服务器明明是utf-8编码,响应头是GBK为何没有出现乱码呢?暂时无解。

       可是咱们把中①的编码contentType编码改成iso-8859-1不兼容中文的编码方式,发现就出现乱码了。

      关于图3中没有出现乱码的缘由,也许咱们可以从浏览器的解码过程当中找到一些提示,请参考:

www.w3.org/html/wg/drafts/html/master/syntax.html#parsing-with-a-known-character-encoding

相关文章
相关标签/搜索