java可供判断某字符串是什么编码的一行代码

时间 2019-11-24

原文原文链接

　　　　 System.out.println("中文");

        System.out.println("中文".getBytes());

        System.out.println("中文".getBytes("GB2312"));

        System.out.println("中文".getBytes("ISO8859_1"));

        System.out.println(new String("中文".getBytes()));

        System.out.println(new String("中文".getBytes(), "GB2312"));

        System.out.println(new String("中文".getBytes(), "ISO8859_1"));

        System.out.println(new String("中文".getBytes("GB2312")));

        System.out.println(new String("中文".getBytes("GB2312"), "GB2312"));

        System.out.println(new String("中文".getBytes("GB2312"), "ISO8859_1"));

        System.out.println(new String("中文".getBytes("ISO8859_1")));

        System.out.println(new String("中文".getBytes("ISO8859_1"), "GB2312"));

        System.out.println(new String("中文".getBytes("ISO8859_1"), "ISO8859_1"));

eg:判断当前字符串的编码格式。html

//判断当前字符串的编码格式
if(destination.equals(new String(destination.getBytes("iso8859-1"), "iso8859-1")))
{
　　destination=new String(destination.getBytes("iso8859-1"),"utf-8");
}

刚学习java的人，对于java中方法request.getParameter(“”)，返回值如果中文，有时会莫名其妙的值变成了乱码比较厌烦。java

即便在处理中加入了数组

　　　　 response.setContentType("text/html;charset=utf-8"); 
        request.setCharacterEncoding("utf-8");
        response.setCharacterEncoding("utf-8");

但效果并无达到预期。究其缘由在于如下几点：浏览器

ServletRequest接口中定义了一个getCharacterEncoding方法，该方法用于返回请求消息中的实体内容的字符集编码名称。若是请求消息中没有指定实体内容的字符集编码名称，则getCharacterEncoding方法返回null。
ServletRequest接口中定义了一个 setCharacterEncoding方法，该方法用于覆盖请求消息中的实体内容的字符集编码名称的设置。getParameter和getReader方法将读取到的实体内容从字节数组形态转换成字符串返回时，都要参照请求消息中的实体内容的字符集编码名称，因此，setCharacterEncoding方法应早于getParameter或getReader方法以前进行调用。
ServletRequest对象的getParameter等方法以哪一种字符集编码对参数进行URL编码，需记下如下三种状况：app

（1）对于HTTP请求消息的请求行中的URL地址后的参数，getParameter等方法进行URL解码时所采用的字符集编码在Servlet规范中没有明确规定，它由各个Servlet引擎厂商自行决定。对于这种状况，Tomcat中的ServletRequest对象的getParameter等方法默认采用ISO8859-1字符集编码进行URL解码，所以没法返回正确的中文参数信息。学习

（2）对于POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容，getParameter等方法以ServletRequest对象的getCharacterEncoding方法返回的字符集编码对其进行URL解码。事实上，对于IE浏览器产生的HTTP请求消息中没有经过任何方式指定对实体内容进行URL编码所采用的字符集编码，那么，Servlet引擎将没法知道请求消息中的实体内容的字符集编码，getCharacterEncoding()方法的返回值为null。对于这种状况，ServletRequest对象的getParameter等方法将使用默认的ISO8859-1字符集编码对实体内容中的参数进行URL解码，所以也将没法返回正确的中文参数信息。编码

（3） ServletRequest接口中定义了一个 setCharacterEncoding方法来设置请求消息中的实体内容的字符集编码名称，getParameter方法将以该方法设置的字符集编码对实体内容进行URL解码，因此，只要使用ServletRequest.setCharacterEncoding方法设置实体内容的字符集编码为其URL编码前的字符集编码，那么getParameter方法就能够从实体内容返回正确的中文参数信息。可是，应该注意一点：ServletRequest.setCharacterEncoding方法设置的是请求消息中的实体内容的字符集编码名称，它只影响getParameter方法对POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容进行URL解码的结果，而不能影响getParameter方法对HTTP请求消息的请求行中的URL地址后的参数进行URL解码的结果。url

因此在servlet开发中对于中文参数值的处理，完整代码以下：spa

　　　　 response.setContentType("text/html;charset=utf-8"); 
        request.setCharacterEncoding("utf-8");
        response.setCharacterEncoding("utf-8");
        String name=Tool.ObjToStr(request.getParameter("name"), "美国");
        if(name.equals(new String(name.getBytes("iso8859-1"), "iso8859-1")))
        {
          name=new String(request.getParameter("name").getBytes("iso8859-1"),"utf-8");
        }