大数据excel导出,内存溢出解决方案(SXSSF流用户模型)
程序员文章站
2022-03-06 23:00:27
...
SXSSF(流用户模型 API)
SXSSF(包:org.apache.poi.xssf.streaming)是 XSSF 的一个 API 兼容的流扩展,当必须生成非常大的电子表格并且堆空间有限时使用。SXSSF 通过限制对滑动窗口内的行的访问来实现其低内存占用,而 XSSF 允许访问文档中的所有行。不再出现在窗口中的旧行将无法访问,因为它们被写入磁盘。
您可以在工作簿构建时通过new SXSSFWorkbook(int windowSize)指定窗口大小, 也可以通过SXSSFSheet#setRandomAccessWindowSize(int windowSize) 为每页设置它
当通过 createRow() 创建新行并且未刷新的记录总数将超过指定的窗口大小时,具有最低索引值的行将被刷新并且无法再通过 getRow() 访问。
默认窗口大小为100,由 SXSSFWorkbook.DEFAULT_WINDOW_SIZE 定义。
windowSize 为 -1 表示无限制访问。在这种情况下,所有未被调用 flushRows() 刷新的记录都可用于随机访问。
请注意,SXSSF通过调用 dispose 方法分配您必须始终明确清除的临时文件。
SXSSFWorkbook 默认使用内联字符串而不是共享字符串表。这是非常有效的,因为不需要将文档内容保存在内存中,但也已知会生成与某些客户端不兼容的文档。启用共享字符串后,文档中的所有唯一字符串都必须保存在内存中。根据您的文档内容,这可能比禁用共享字符串使用更多的资源。
请注意,根据您使用的功能,仍有一些内容可能会消耗大量内存,例如合并区域、超链接、评论……仍然只存储在内存中,因此可能需要大量内存,如果广泛使用。
在决定是否启用共享字符串之前,请仔细检查您的内存预算和兼容性需求。
下面的示例编写了一个带有 100 行窗口的工作表。当行数达到 101 时,将 rownum=0 的行刷新到磁盘并从内存中删除,当 rownum 达到 102 时,则刷新 rownum=1 的行,以此类推。
mport junit.framework.Assert;
mport org.apache.poi.ss.usermodel.Cell;
mport org.apache.poi.ss.usermodel.Row;
mport org.apache.poi.ss.usermodel.Sheet;
mport org.apache.poi.ss.usermodel.Workbook;
mport org.apache.poi.ss.util.CellReference;
mport org.apache.poi.xssf.streaming.SXSSFWorkbook;
public static void main(String[] args) throws Throwable {
SXSSFWorkbook wb = new SXSSFWorkbook(100); // keep 100 rows in memory, exceeding rows will be flushed to disk
Sheet sh = wb.createSheet();
for(int rownum = 0; rownum < 1000; rownum++){
Row row = sh.createRow(rownum);
for(int cellnum = 0; cellnum < 10; cellnum++){
Cell cell = row.createCell(cellnum);
String address = new CellReference(cell).formatAsString();
cell.setCellValue(address);
}
}
// Rows with rownum < 900 are flushed and not accessible
for(int rownum = 0; rownum < 900; rownum++){
Assert.assertNull(sh.getRow(rownum));
}
// ther last 100 rows are still in memory
for(int rownum = 900; rownum < 1000; rownum++){
Assert.assertNotNull(sh.getRow(rownum));
}
FileOutputStream out = new FileOutputStream("/temp/sxssf.xlsx");
wb.write(out);
out.close();
// dispose of temporary files backing this workbook on disk
wb.dispose();
}
上一篇: 为了卖菜已经很努力了