转载的出处:https://blog.csdn.net/andyzhaojianhui/article/details/51819021javascript
form有2中方法把数据提交给服务器,get和post,分别说下吧。
(一)get提交
1.首先说下客户端(浏览器)的form表单用get方法是如何将数据编码后提交给服务器端的吧。
对于get方法来讲,都是把数据串联在请求的url后面做为参数,如:http://localhost:8080/servlet?msg=abc
(很常见的一个乱码问题就要出现了,若是url中出现中文或其它特殊字符的话,如:http://localhost:8080 /servlet?msg=杭州,服务器端容易获得乱码),url拼接完成后,浏览器会对url进行URL encode,而后发送给服务器,URL encode的过程就是把部分url作为字符,按照某种编码方式(如:utf-8,gbk等)编码成二进制的字节码,而后每一个字节用一个包含3个字符的字符串 "%xy" 表示,其中xy为该字节的两位十六进制表示形式。具体介绍能够看下java.net.URLEncoder类的介绍。html
了解了URL encode的过程,咱们能看到2个很重要的问题:前端
第一:须要URL encode的字符通常都是非ASCII的字符(笼统的讲),再通俗的讲就是除了英文字母之外的文字(如:中文,日文等)都要进行URL encode,因此对于咱们来讲,都是英文字母的url不会出现服务器获得乱码问题,出现乱码都是url里面带了中文或特殊字符形成的;java
第二:URL encode到底按照那种编码方式对字符编码?这里就是浏览器的事情了,并且不一样的浏览器有不一样的作法,中文版的浏览器通常会默认的使用GBK,经过设置浏览器也可使用UTF-8,可能不一样的用户就有不一样的浏览器设置,也就形成不一样的编码方式,因此不少网站的作法都是先把url里面的中文或特殊字符用 javascript作URL encode,而后再拼接url提交数据,也就是替浏览器作了URL encode,好处就是网站能够统一get方法提交数据的编码方式。 完成了URL encode,那么如今的url就成了ASCII范围内的字符了,而后以iso-8859-1的编码方式转换成二进制随着请求头一块儿发送出去。
2。服务器端(tomcat)是如何将数据获取到进行解码的。
第一步是先把数据用iso-8859-1进行解码,对于get方法来讲,tomcat获取数据的是ASCII范围内的请求头字符,其中的请求url里面带有参数数据,若是参数中有中文等特殊字符,那么目前仍是URL encode后的%XY状态,先停下,咱们先说下开发人员通常获取数据的过程。一般你们都是request.getParameter("name")获取参数数据,咱们在request对象或得的数据都是通过解码过的,而解码过程当中程序里是没法指定,这里要说下,有不少新手说用request.setCharacterEncoding("字符集")能够指定解码方式,实际上是不能够的,看servlet的官方API说明有对此方法的解释:Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().能够看出对于get方法他是无能为力的。那么到底用什么编码方式解码数据的呢,这是tomcat的事情了,默认缺省用的是 iso-8859-1,这样咱们就能找到为何get请求带中文参数为何在服务器端获得乱码了,缘由是在客户端通常都是用UTF-8或GBK对数据 URL encode,这里用iso-8859-1方式URL decoder显然不行,在程序里咱们能够直接
Java代码
1. new String(request.getParameter("name").getBytes("iso-8859-1"),"客户端指定的URL encode编码方式")
还原回字节码,而后用正确的方式解码数据,网上的文章一般是在tomcat里面作个配置
Xml代码
1. <Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK"/>
这样是让tomcat在获取数据后用指定的方式URL decoder,URL decoder的介绍在这里
(二)post提交
1.客户端(浏览器)的form表单用post方法是如何将数据编码后提交给服务器端的。
在post方法里所要传送的数据也要URL encode,那么他是用什么编码方式的呢?
在form所在的html文件里若是有段<meta http-equiv="Content-Type" content="text/html; charset=字符集(GBK,utf-8等)"/>,那么post就会用此处指定的编码方式编码。通常你们都认为这段代码是为了让浏览器知道用什么字符集来对网页解释,因此网站都会把它放在html代码的最前端,尽可能不出现乱码,其实它还有个做用就是指定form表单的post方法提交数据的 URL encode编码方式。从这里能够看出对于get方法来数,浏览器对数据的URL encode的编码方式是有浏览器设置来决定,(能够用js作统一指定),而post方法,开发人员能够指定。
2。服务器端(tomcat)是如何将数据获取到进行解码的。
若是用tomcat默认缺省设置,也没作过滤器等编码设置,那么他也是用iso-8859-1解码的,可是request.setCharacterEncoding("字符集")能够派上用场。 浏览器