一、前言
上面写了console的乱码问题,接下来写的是web中servlet中的问题,大楷我比较关心一点,因为遇到这个的情况多一些吧。直接开始吧。
二、jsp和servlet中的乱码问题
其实在java文件的编译的情况和(一)中的情况是一样的,不过这里是由WEB容器去调用JVM而已,那么我们得知道一些默认的东西
比如特别重要的:(摘要)
如果Servlet 在运行的过程中,需要接受从客户端传来的字符如:表单输入的值和URL中传入的值,此时如果程序中没有设定接受参数时采用的编码格式,则WEB 容器会默认采用ISO-8859-1 编码格式来接受传入的值并在JVM 中转化为UNICODE 格式的保存在WEB 容器的内存中。Servlet 运行后生成输出,输出的字符串是UNICODE 格式的,紧接着,容器将Servlet 运行产生的UNICODE 格式的串(如html语法,用户输出的串等)直接发送到客户端浏览器上并输出给用户,如果此时指定了发送时输出的编码格式,则按指定的编码格式输出到浏览器上,如果没有指定,则默认按ISO-8859-1 编码发送到客户的浏览器上。
注意是ISO-8859-1就行了,tomcat 5.0之前采用是由用户设置的编码方式解析,tomcat 5.0过后有个参数(useBodyEncodingForURI)被默认了false,就使用了ISO-8859-1解析了,这儿是配置中的关键。
public class Hello extends HttpServlet {
private static final long serialVersionUID = 4878915372815719687L;
public Hello() {
super();
}
public void destroy() {
super.destroy(); // Just puts "destroy" string in log
}
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
//输入:设置请求编码格式
request.setCharacterEncoding("GBK");
//输出:设置响应编码格式
response.setContentType("text/html; charset=GBK");
PrintWriter out = response.getWriter();
out.write("<hr>");
out.write("Hello, 中文!");
out.write("<hr>");
}
public void doPost(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
//输入:设置请求编码格式
request.setCharacterEncoding("GBK");
//输出:设置响应编码格式
response.setContentType("text/html; charset=GBK");
//从请求中接收参数
String input_str = request.getParameter("input_str");
String url_arg = request.getParameter("url_arg");
//出错处理
input_str = (null == input_str) ? "" : input_str;
url_arg = (null == url_arg) ? "" : url_arg;
PrintWriter out = response.getWriter();
out.write("<hr>");
out.println("您输入的字符串是:" + input_str);
out.write("<hr>");
//out.println("您的表单传递的URL参数是:" + new String(url_arg.getBytes("ISO-8859-1"), "GBK"));
out.println("您的表单传递的URL参数是:" + url_arg);
out.write("<hr>");
}
public void init() throws ServletException {
// Put your code here
}
}