(转)Java 文件分块上传客户端源代码
本博客介绍如何进行文件的分块上传。本文侧重介绍客户端,服务器端请参考博客《Java 文件分块上传服务器端源代码》。建议读者朋友在阅读本文代码前先了解一下 MIME 协议。
所谓分块上传并非把大文件进行物理分块,然后挨个上传,而是依次读取大文件的一部分文件流进行上传。分块,倒不如说分流比较切实。本文通过一个项目中的示例,说明使用 Apache 的 HttpComponents/HttpClient 对大文件进行分块上传的过程。示例使用的版本是 HttpComponents Client 4.2.1。
本文仅以一小 demo 功能性地解释 HttpComponents/HttpClient 分块上传,没有考虑 I/O 关闭、多线程等资源因素,读者可以根据自己的项目酌情处理。
本文核心思想及流程:以 100 MB 大小为例,大于 100 MB 的进行分块上传,否则整块上传。对于大于 100 MB 的文件,又以 100 MB 为单位进行分割,保证每次以不大于 100 MB 的大小进行上传。比如 304 MB 的一个文件会分为 100 MB、100 MB、100 MB、4 MB 等四块依次上传。第一次读取 0 字节开始的 100 MB 个字节,上传;第二次读取第 100 MB 字节开始的 100 MB 个字节,上传;第三次读取第 200 MB 字节开始的 100 MB 个字节,上传;第四次读取最后剩下的 4 MB 个字节进行上传。
自定义的 ContentBody 源码如下,其中定义了流的读取和输出:
package com.defonds.rtupload.common.util.block; import java.io.File; import java.io.IOException; import java.io.OutputStream; import java.io.RandomAccessFile; import org.apache.http.entity.mime.content.AbstractContentBody; import com.defonds.rtupload.GlobalConstant; public class BlockStreamBody extends AbstractContentBody { //给MultipartEntity看的2个参数 private long blockSize = 0;//本次分块上传的大小 private String fileName = null;//上传文件名 //writeTo需要的3个参数 private int blockNumber = 0, blockIndex = 0;//blockNumber分块数;blockIndex当前第几块 private File targetFile = null;//要上传的文件 private BlockStreamBody(String mimeType) { super(mimeType); // TODO Auto-generated constructor stub } /** * 自定义的ContentBody构造子 * @param blockNumber分块数 * @param blockIndex当前第几块 * @param targetFile要上传的文件 */ public BlockStreamBody(int blockNumber, int blockIndex, File targetFile) { this("application/octet-stream"); this.blockNumber = blockNumber;//blockNumber初始化 this.blockIndex = blockIndex;//blockIndex初始化 this.targetFile = targetFile;//targetFile初始化 this.fileName = targetFile.getName();//fileName初始化 //blockSize初始化 if (blockIndex < blockNumber) {//不是最后一块,那就是固定大小了 this.blockSize = GlobalConstant.CLOUD_API_LOGON_SIZE; } else {//最后一块 this.blockSize = targetFile.length() - GlobalConstant.CLOUD_API_LOGON_SIZE * (blockNumber - 1); } } @Override public void writeTo(OutputStream out) throws IOException { byte b[] = new byte[1024];//暂存容器 RandomAccessFile raf = new RandomAccessFile(targetFile, "r");//负责读取数据 if (blockIndex == 1) {//第一块 int n = 0; long readLength = 0;//记录已读字节数 while (readLength <= blockSize - 1024) {//大部分字节在这里读取 n = raf.read(b, 0, 1024); readLength += 1024; out.write(b, 0, n); } if (readLength <= blockSize) {//余下的不足 1024 个字节在这里读取 n = raf.read(b, 0, (int)(blockSize - readLength)); out.write(b, 0, n); } } else if (blockIndex < blockNumber) {//既不是第一块,也不是最后一块 raf.seek(GlobalConstant.CLOUD_API_LOGON_SIZE * (blockIndex - 1));//跳过前[块数*固定大小 ]个字节 int n = 0; long readLength = 0;//记录已读字节数 while (readLength <= blockSize - 1024) {//大部分字节在这里读取 n = raf.read(b, 0, 1024); readLength += 1024; out.write(b, 0, n); } if (readLength <= blockSize) {//余下的不足 1024 个字节在这里读取 n = raf.read(b, 0, (int)(blockSize - readLength)); out.write(b, 0, n); } } else {//最后一块 raf.seek(GlobalConstant.CLOUD_API_LOGON_SIZE * (blockIndex - 1));//跳过前[块数*固定大小 ]个字节 int n = 0; while ((n = raf.read(b, 0, 1024)) != -1) { out.write(b, 0, n); } } //TODO 最后不要忘掉关闭out/raf } @Override public String getCharset() { // TODO Auto-generated method stub return null; } @Override public String getTransferEncoding() { // TODO Auto-generated method stub return "binary"; } @Override public String getFilename() { // TODO Auto-generated method stub return fileName; } @Override public long getContentLength() { // TODO Auto-generated method stub return blockSize; } }
在自定义的 HttpComponents/HttpClient 工具类 HttpClient4Util 里进行分块上传的封装:
public static String restPost(String serverURL, File targetFile,Map<String, String> mediaInfoMap){ String content =""; try { DefaultHttpClient httpClient = new DefaultHttpClient(); HttpPost post = new HttpPost(serverURL +"?"); httpClient.getParams().setParameter("http.socket.timeout",60*60*1000); MultipartEntity mpEntity = new MultipartEntity(); List<String> keys = new ArrayList<String>(mediaInfoMap.keySet()); Collections.sort(keys, String.CASE_INSENSITIVE_ORDER); for (Iterator<String> iterator = keys.iterator(); iterator.hasNext();) { String key = iterator.next(); if (StringUtils.isNotBlank(mediaInfoMap.get(key))) { mpEntity.addPart(key, new StringBody(mediaInfoMap.get(key))); } } if(targetFile!=null&&targetFile.exists()){ ContentBody contentBody = new FileBody(targetFile); mpEntity.addPart("file", contentBody); } post.setEntity(mpEntity); HttpResponse response = httpClient.execute(post); content = EntityUtils.toString(response.getEntity()); httpClient.getConnectionManager().shutdown(); } catch (Exception e) { e.printStackTrace(); } System.out.println("=====RequestUrl==========================\n" +getRequestUrlStrRest(serverURL, mediaInfoMap).replaceAll("&fmt=json", "")); System.out.println("=====content==========================\n"+content); return content.trim(); }
其中 "file" 是分块上传服务器对分块文件参数定义的名字。细心的读者会发现,整块文件上传直接使用 Apache 官方的 InputStreamBody,而分块才使用自定义的 BlockStreamBody。
最后调用 HttpClient4Util 进行上传:
public static Map<String, String> uploadToDrive( Map<String, String> params, String domain) { File targetFile = new File(params.get("filePath")); long targetFileSize = targetFile.length(); int mBlockNumber = 0; if (targetFileSize < GlobalConstant.CLOUD_API_LOGON_SIZE) { mBlockNumber = 1; } else { mBlockNumber = (int) (targetFileSize / GlobalConstant.CLOUD_API_LOGON_SIZE); long someExtra = targetFileSize % GlobalConstant.CLOUD_API_LOGON_SIZE; if (someExtra > 0) { mBlockNumber++; } } params.put("blockNumber", Integer.toString(mBlockNumber)); if (domain != null) { LOG.debug("Drive---domain=" + domain); LOG.debug("drive---url=" + "http://" + domain + "/sync" + GlobalConstant.CLOUD_API_PRE_UPLOAD_PATH); } else { LOG.debug("Drive---domain=null"); } String responseBodyStr = HttpClient4Util.getRest("http://" + domain + "/sync" + GlobalConstant.CLOUD_API_PRE_UPLOAD_PATH, params); ObjectMapper mapper = new ObjectMapper(); DrivePreInfo result; try { result = mapper.readValue(responseBodyStr, ArcDrivePreInfo.class); } catch (IOException e) { LOG.error("Drive.preUploadToArcDrive error.", e); throw new RtuploadException(GlobalConstant.ERROR_CODE_13001);// TODO } // JSONObject jsonObject = JSONObject.fromObject(responseBodyStr); if (Integer.valueOf(result.getRc()) == 0) { int uuid = result.getUuid(); String upsServerUrl = result.getUploadServerUrl().replace("https", "http"); if (uuid != -1) { upsServerUrl = upsServerUrl + GlobalConstant.CLOUD_API_UPLOAD_PATH; params.put("uuid", String.valueOf(uuid)); for (int i = 1; i <= mBlockNumber; i++) { params.put("blockIndex", "" + i); HttpClient4Util.restPostBlock(upsServerUrl, targetFile, params);// } } } else { throw new RtuploadException(GlobalConstant.ERROR_CODE_13001);// TODO } return null; }
其中 params 这个 Map 里封装的是服务器分块上传所需要的一些参数,而上传块数也在这里进行确定。
本文中的示例经本人测试能够上传大文件成功,诸如 *.mp4 的文件上传成功没有出现任何问题。如果读者朋友测试时遇到问题无法上传成功,请在博客后跟帖留言,大家共同交流下。本文示例肯定还存在很多不足之处,如果读者朋友发现还请留言指出,笔者先行谢过了。