httpclient编码设置问题
dwd4
10年前
1、非流式读取
HttpClient中可以之间使用HttpMethod的getResponseBodyAsString()方法获取返回的内容,在读取之前,如果需要做编码设置可以这样:
HttpMethod get=new GetMethod(url);
httpClient.executeMethod(get);
get.getParams().setContentCharset("GBK");
这么做虽然可以解决中文乱码问题,但是在HttpClient 3.1中这种方法是不推荐的,会发出警告。
2、流式读取
HttpClient推荐使用流式的读取返回内容,如下:
BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream()));
String tmp=null;
String htmlRet="";
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}
System.out.println(new String(htmlRet.getBytes(),"GB2312"));
但是经过尝试发现这样会出现中文乱码问题。经过N次实验后,将上面代码修改如下,乱码问题随之解决。
HttpClient httpClient=new HttpClient();
HttpMethod get=new GetMethod(send_url);
try {
httpClient.executeMethod(get);
//System.out.println(get.getResponseBodyAsString());
BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream(),"ISO-8859-1"));
String tmp=null;
String htmlRet="";
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}
System.out.println(new String(htmlRet.getBytes("ISO-8859-1"),"GB2312"));
} catch (HttpException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}finally{
get.releaseConnection();
}
HttpClient中可以之间使用HttpMethod的getResponseBodyAsString()方法获取返回的内容,在读取之前,如果需要做编码设置可以这样:
HttpMethod get=new GetMethod(url);
httpClient.executeMethod(get);
get.getParams().setContentCharset("GBK");
这么做虽然可以解决中文乱码问题,但是在HttpClient 3.1中这种方法是不推荐的,会发出警告。
2、流式读取
HttpClient推荐使用流式的读取返回内容,如下:
BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream()));
String tmp=null;
String htmlRet="";
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}
System.out.println(new String(htmlRet.getBytes(),"GB2312"));
但是经过尝试发现这样会出现中文乱码问题。经过N次实验后,将上面代码修改如下,乱码问题随之解决。
HttpClient httpClient=new HttpClient();
HttpMethod get=new GetMethod(send_url);
try {
httpClient.executeMethod(get);
//System.out.println(get.getResponseBodyAsString());
BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream(),"ISO-8859-1"));
String tmp=null;
String htmlRet="";
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}
System.out.println(new String(htmlRet.getBytes("ISO-8859-1"),"GB2312"));
} catch (HttpException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}finally{
get.releaseConnection();
}