在企业应用中,处理 excel 文件是非常常见的需求,无论是财务报表、销售统计,还是数据分析,合并 excel 文件都是必不可少的操作。不同的业务场景对合并方式的要求也各不相同,以下是几类常见的 excel 合并场景:
- 按文件合并:将多个 excel 文件的数据整合到一个新文件中,每个文件对应一个工作表。
- 合并工作表:将同一工作簿中不同工作表的数据汇总到一个工作表中,方便统计和分析。
- 批量合并:处理大量 excel 文件,将所有数据汇总到统一格式的表格中。
- 统一表头:多个文件的表头可能不一致,合并时需要先统一表头再整合数据。
接下来,我们将结合这些场景,介绍几种在 java 中实现 excel 文件合并的方法。
环境准备与依赖安装
在开始操作之前,需要准备以下环境:
- java 8 或以上版本
- spire.xls for java(支持 excel 2003、2007及以上版本)
- ide(如 intellij idea 或 eclipse)
在项目中引入 spire.xls 依赖:
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupid>e-iceblue</groupid>
<artifactid>spire.xls</artifactid>
<version>16.3.2</version>
</dependency>
</dependencies>注意:版本号根据你实际下载的 spire.xls for java 版本替换即可。
示例一:合并多个 excel 文件
如果需要将多个 excel 文件合并到一个新文件,可以通过逐个文件、逐个工作表复制的方式实现。使用 workbook.getworksheets().addcopy() 方法可以完整保留工作表的内容,包括数据、格式、公式、图表和条件格式。在处理较大文件时,建议每次加载一个文件,以避免内存占用过高。
import com.spire.xls.*;
public class mergeexcels {
public static void main(string[] args){
string[] inputfiles = new string[]{"budget summary.xlsx", "income.xlsx", "expenses.xlsx"};
workbook newbook = new workbook();
newbook.getworksheets().clear();
workbook tempbook = new workbook();
for (string file : inputfiles) {
tempbook.loadfromfile(file);
for (worksheet sheet : (iterable) tempbook.getworksheets()) {
newbook.getworksheets().addcopy(sheet, worksheetcopytype.copyall);
}
}
newbook.savetofile("mergefiles.xlsx", excelversion.version2013);
system.out.println("合并完成!");
}
}
示例二:将多个工作表的数据合并到同一个工作表
当需要将多个工作表的数据汇总到同一个总表时,可以选定一个主工作表,将其他工作表的数据追加到其末尾。使用 cellrange.copy() 方法可以精确复制数据区域,同时保持原有的单元格格式和样式。处理时要注意跳过表头,避免重复添加。
import com.spire.xls.*;
public class mergeexcelworksheets {
public static void main(string[] args){
workbook workbook = new workbook();
workbook.loadfromfile("input.xlsx");
worksheet sheet1 = workbook.getworksheets().get(0);
worksheet sheet2 = workbook.getworksheets().get(1);
cellrange sourcerange = sheet2.getallocatedrange();
cellrange destrange = sheet1.getcellrange(sheet1.getlastrow() + 1, 1);
sourcerange.copy(destrange);
sheet2.remove();
workbook.savetofile("mergeworksheets.xlsx", excelversion.version2013);
system.out.println("工作表数据合并完成!");
}
}
示例三:批量合并目录下的 excel 文件
如果要处理整个目录中的所有 excel 文件,可以遍历文件夹,按文件和工作表顺序复制到新的工作簿。addcopy() 方法同样适用,这样可以一次性处理大量报表,提高效率。处理大量文件时,最好按文件分批加载,以减少内存压力。
import com.spire.xls.*;
import java.io.file;
public class mergeexceldirectory {
public static void main(string[] args){
file folder = new file("excel_folder");
file[] files = folder.listfiles((dir, name) -> name.endswith(".xlsx"));
workbook newbook = new workbook();
newbook.getworksheets().clear();
workbook tempbook = new workbook();
for (file file : files) {
tempbook.loadfromfile(file.getabsolutepath());
for (worksheet sheet : (iterable) tempbook.getworksheets()) {
newbook.getworksheets().addcopy(sheet, worksheetcopytype.copyall);
}
}
newbook.savetofile("mergeddirectory.xlsx", excelversion.version2013);
system.out.println("批量合并完成!");
}
}
示例四:合并 excel 文件并统一表头
当源文件表头不一致或缺失时,可以先在目标工作表中设置统一表头,然后将各文件的数据依次复制到对应位置。cellrange.copy() 可以确保数据正确对齐,行号累加避免覆盖。这样可以生成结构一致的总表,便于后续分析或统计。
import com.spire.xls.*;
public class mergewithheader {
public static void main(string[] args){
string[] files = {"jan.xlsx", "feb.xlsx", "mar.xlsx"};
workbook workbook = new workbook();
workbook.getworksheets().clear();
worksheet mastersheet = workbook.getworksheets().add("summary");
mastersheet.getcellrange("a1").settext("日期");
mastersheet.getcellrange("b1").settext("销售额");
mastersheet.getcellrange("c1").settext("成本");
int currentrow = 2;
workbook temp = new workbook();
for (string file : files) {
temp.loadfromfile(file);
worksheet sheet = temp.getworksheets().get(0);
cellrange datarange = sheet.getallocatedrange();
cellrange dest = mastersheet.getcellrange(currentrow, 1);
datarange.copy(dest);
currentrow += datarange.getrowcount();
}
workbook.savetofile("mergedwithheader.xlsx", excelversion.version2013);
system.out.println("数据合并并统一表头完成!");
}
}
合并 excel 文件的注意事项
- 列结构一致性:按行合并时注意各工作表的列顺序和数量,避免数据错位。
- 数据类型保持一致:数字、日期、文本类型最好统一。
- 内存优化:批量处理大量文件时,可分批加载,避免内存占用过高。
- 格式保留:需要保留公式、样式和图表时,使用
worksheetcopytype.copyall。 - 表头统一:合并数据前最好统一表头,特别是源文件列名不一致时。
方法补充
在 java 中合并 excel 文件,有多种成熟的库可供选择。主要分为两大类:开源免费的 apache poi 和 easyexcel,以及功能强大的 aspose.cells 等商业库。
方案对比
| 方面 | 开源方案 (推荐) | 商业方案 (按需选择) |
|---|---|---|
| 代表库 | apache poi, easyexcel | aspose.cells, spire.xls |
| 优点 | 免费、社区活跃、灵活性强 | 功能强大、文档详尽、合并更稳定、保留样式好 |
| 缺点 | 代码相对繁琐,处理复杂格式或大文件时需注意内存溢出问题 | 需要付费 |
| 适用场景 | 大多数通用需求,优先推荐的开源免费方案 | 对合并的格式、样式有极高要求,或需处理超大数据量的企业级应用 |
主流的实现方案
1. 使用 apache poi (功能丰富,灵活可控)
这是最经典的java处理excel方案,虽然代码量稍多,但提供了最大的灵活性。
步骤: 引入依赖 -> 遍历文件 -> 创建工作表和 sheet -> 复制数据, 样式及合并单元格信息 -> 保存
注意:手动复制样式需要额外代码,大文件下 注意内存占用问题。
maven 依赖
<dependency>
<groupid>org.apache.poi</groupid>
<artifactid>poi</artifactid>
<version>5.2.4</version>
</dependency>
<dependency>
<groupid>org.apache.poi</groupid>
<artifactid>poi-ooxml</artifactid>
<version>5.2.4</version>
</dependency>2. 使用 easyexcel (api 简洁,内存友好)
这是阿里开源的工具,api设计简洁,内存占用更低。
maven 依赖
<dependency>
<groupid>com.alibaba</groupid>
<artifactid>easyexcel</artifactid>
<version>3.3.4</version>
</dependency>// 注意:该示例简单合并了所有文件的内容,表头会重复出现。
// 在实际使用中还需完善,例如跳过后续文件的表头等。
public static void mergeexcelfiles(list<file> inputfiles, file outputfile) {
excelwriter excelwriter = easyexcel.write(outputfile).build();
for (file inputfile : inputfiles) {
list<list<object>> data = easyexcel.read(inputfile)
.sheet()
.doreadsync();
excelwriter.write(data, easyexcel.writersheet().build());
}
excelwriter.finish();
}3. 使用 aspose.cells (工业级方案)
使用方式
- 直接合并:通过
workbook的combine方法快速合并。 - 精确复制:通过
worksheet.copy方法精确控制工作表复制。 - 缓存合并:对于大量文件,可使用
cellshelper.mergefiles方法提升效率。
maven 依赖
<dependency>
<groupid>com.aspose</groupid>
<artifactid>aspose-cells</artifactid>
<version>25.3</version>
</dependency>4. 使用 groupdocs.merger
此方案适合需要简单快捷地将excel文档合并为一个,而不关心内部工作表结构的场景。
maven 依赖
<dependency>
<groupid>com.groupdocs</groupid>
<artifactid>groupdocs-merger</artifactid>
<version>23.7</version>
</dependency>总结
本文介绍了 java 中四种常用的 excel 合并方法:
- 按文件合并:完整保留每个工作表,适合整合报表或项目数据。
- 合并工作表数据到单表:将多个工作表数据汇总到一个总表,便于统计分析。
- 批量合并目录下文件:一次性处理整个目录中的 excel 文件,提高效率。
- 统一表头合并:在源文件表头不一致的情况下,生成结构统一的总表。
通过合理选择方法,可以显著提高处理 excel 数据的效率和准确性。
到此这篇关于java中合并excel文件的实用方法详解的文章就介绍到这了,更多相关java合并excel文件内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论