web文件上传下载原理浅析

程序员文章站 2022-06-02 14:16:32

...

一、web文件上传浅析

现在有很多Web程序都有上传功能，实现上传功能的组件或框架也很多，如基于java的Commons FileUpload、还有Struts1.x和Struts2中带的上传文件功能（实际上，Struts2在底层也使用了Commons FileUpload）。在asp.net中也有相应的上传文件的控件。

虽然现在有很多上传组件可以利用，但是了解Web上传文件的原理，对于处理突然出现的问题会有很大的帮助，下面就来讲一下通过浏览器上传文件的基本原理。在了解了原理之后，就可以非常容易地自制满足自身需要的上传组件了。

众所周知，在客户端代码中需要使用<input type='file' name='file' />来选择要上传的文件，并上传，代码如上：

<html>
    <head>
        <title>upload</title>
        <meta http-equiv="description" content="this is my page">
        <meta http-equiv="content-type" content="text/html; charset=GB18030">
    </head>

    <body>
        <form action="servlet/UploadFile" method="post"
            enctype="multipart/form-data">
            <input type="file" name="file1" id="file1" />
            <input type="file" name="file2" id="file2" />
            <input type="submit" value="上传" />
        </form>
    </body>
</html>

从上面的代码可以看出，有两个文件选择框（file1和file2），在上传文件时，<form>标签必须加上enctype="multipart/form-data"，否则浏览器无法将文件内容上传到服务端。下面我们来做个实验。在Servlet的doPost方法中编写如下的代码，如果想使用asp.net或其他的语言或技术，也可以很容易实现相应的功能。

 public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException
    {
        java.io.InputStream is = request.getInputStream();
        java.io.FileOutputStream fos = new java.io.FileOutputStream("d:\\out.txt");
        
        byte[] buffer = new byte[8192];
        int count = 0;
        while((count = is.read(buffer)) >0)
        {
            fos.write(buffer, 0, count);
        }        
        fos.close();
    }

上面的功能非常简单，只是通过request获得一个InputStream对象，并通过这个对象从客户端获得发送过来的字节流（注意，一定要用字节流，因为，上传的文件可能是二进制文件，如图象文件，因此，使用字节流会更通用）。并将这些字节流保存在D盘的out.txt文件中。然后我们打开out.txt，文件的内容如图1所示：
web文件上传下载原理浅析

图1

由于out.txt是使用文本形式打开的，并且file1上传的是a.jpg(一个图象文件)，因此，显示的是一些乱码。我们可以不用管它们。只需要看看这些内容的头部。我们很快就可以找到规律。每一个文件内容的头部都由“-----------------------------30514443229777”分隔，然后是这个文件的属性，如下：

Content-Disposition: form-data; name="file1"; filename="a.jpg"

Content-Type: image/jpeg

其中包含了文件选择框的name属性，还有上传的文件名（filename字段），要注意的，firefox在上传时，这个filename属性值只是文件名，如果使用IE，就是带路径的文件名，如D:"a.jpg。

接下来的规则就和HTTP的头一样了，以一个空行（"r"n）分隔。后面就是文件的具体内容。现在最关键的文件的结尾，从图1可以看出，文件的结尾也是“-----------------------------30514443229777”，因此，可以断定，第一个上传的文件（包括文件头）是夹在两个“-----------------------------30514443229777”之间的。而“-----------------------------30514443229777”就是multipart/form-data协议的分隔符。但这里还有一个最关键的问题。这个分隔符每次上传都不一样，服务端是如何知道每次上传的这个分隔符的呢？

实际上，这个分隔符是通过HTTP请求头的Content-Type字段获得，可通过下面的代码输出这个字段值：

System.out.println(request.getHeader("Content-type"));

输出的内容如下：

multipart/form-data; boundary=---------------------------106712230227687

只要在服务端获得boundary后面的值即可。经过测试，Content-Type中的分隔符号中的“-”比实际上传的“-”少两个，不知是怎么回事。不过这没关系，我们可以认为每一个文件块是以""r"n—“结尾的，或是直接将从boundary获得的分隔符加两个“—”。而最后结尾的分隔符是“---------------------------106712230227687—”，后面多了两个“—”。

综合上述，也就是说，一个文件块是以“---------------------------106712230227687”开头，以“—”结尾，从图2可以看出这一切。

图 2

至于剩下的工作，就是按着上面的规则来分析这些字符流了。分析的方法很多。在这里就不详述了。

multipart/form-data规范原文：http://www.ietf.org/rfc/rfc2388.txt
Form-based File Upload in HTML：http://www.ietf.org/rfc/rfc1867.txt

二、web文件下载浅析

文件下载流程

服务器端编码原理下载分析：在服务端通过response可以获取到输出流，在服务端通过输入流将文件流获取到然后通过response获取输出流直接写回到浏览器即可完成下载。

服务器端下载两个响应头设置

怎样能通知浏览器，下载文件是什么：通过response.setContentType设置响应数据的mimeType类型。获取一个文件的mimeType类型，ServletContext.getMimeType(String filename)
设置下载文件名称：response.setHeader("Content-Disposition","attachement;filename=下载名称")

下载乱码问题

对于下载时，我们在显示文件下载名称的时候，如果包含了中文，就可能出现乱码问题。原因在于不同的浏览器，他们在处理下载文件的时候编码不一致，ie浏览器使用的是utf-8编码，而firefox使用的是base64编码。所以在下载还需要设置编码格式。示例如下：

		response.setCharacterEncoding("utf-8");
		String filename = request.getParameter("filename");
		String downPath = path+"/upload";
		FileInputStream in = new FileInputStream(downPath+File.separator+filename);

		if(request.getHeader("user-agent").toLowerCase().contains("msie")){
			filename = URLEncoder.encode(filename, "UTF-8");
		}else{
			filename = new String(filename.getBytes("UTF-8"),"iso-8859-1");
		}
		response.setHeader("content-disposition", "attachment;filename="+filename);
		response.setHeader("content-type",this.getServletContext().getMimeType(filename));

		OutputStream os = response.getOutputStream();
		byte[] buffer = new byte[1024];
		int len=0;      
		while((len=in.read(buffer))!=-1) {
			os.write(buffer, 0, len);
		}
		in.close();
		os.close();

转载地址：https://www.cnblogs.com/nokiaguy/archive/2008/05/29/1209858.html

相关标签：文件下载 web 浏览器

上一篇：如何为Flash减肥？精简Flash文件体积的几个小技巧总结

下一篇：古代天牢和地牢有什么区别呢哪一个*更可怕呢

web文件上传下载原理浅析

一、web文件上传浅析

二、web文件下载浅析

文件下载流程

服务器端下载两个响应头设置

下载乱码问题

浅谈web上存漏洞及原理分析、防范方法（文件名检测漏洞）

Gin-Go学习笔记四：Gin-Web框架文件的上传下载

浅谈web上存漏洞及原理分析、防范方法（安全文件上存方法）

浅析PHP文件下载原理，

浅析PHP文件下载原理