欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

通过URL获取网络资源

程序员文章站 2022-05-05 20:39:15
...
得到网络文件
但是在得到的文件中如出现中文则出现乱码问题:
网络传输肯定是用byte[]的,不可能直接把String对象给传过来,所以server想把某个字符串传给client之前,需要将他转成 byte[] , 这中间就用了server指定的一种编码,client在收到这个 byte[]之后,就必须要采用和server相同的编码,把byte[]重新转换为String。这就是InputStreamReader需要指定一个编码的原因。
InputStreamReader作用就是在通过inputStream读到byte[]的同时,将byte[]用指定的编码,转换为 char[],也就是实际上的String.

StringBuffer sb=new StringBuffer();
BufferedReader br=null;
String line=null;
try
{
url=new URL(“http://baidu.com/peon.txt");
URLConnection urlConn=(URLConnection)url.openConnection();

br=new BufferedReader(new InputStreamReader(urlConn.getInputStream(),"GB2312"));
//解决中文乱码问题
while((line=br.readLine())!=null)
{
sb.append(line);
}
}
catch(Exception e)
{
e.printStackTrace();
}
finally
{
try
{
br.close();
}
catch(Exception e)
{
e.printStackTrace();
}
}

但是问题又出现了,如果下载的文件名里有中文如测试.txt 那么在下载的时候就会找不到此文件URL url=new URL("http://10.0.2.2:8090/mp3/测试.txt"); 无效
更改:
String name=URLEncoder.encode("测试", "UTF-8");
URL url=new URL("http://10.0.2.2:8090/mp3/"+name+".txt");
在试验中也是无效的。即使改utf-8为8859_1或者gb2312
这时我发现如果在tomcat服务器中更别tomcat的编码 在用相应的解码就可以访问到该文件了。如
<Connector port="8090" protocol="HTTP/1.1"
maxThreads="150" connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8"/>
但是我很纳闷 它默认的编码格式是什么呢 ?难道不是以上三种么?
相关标签: Tomcat