Java实现读取Excel文件功能(EasyExcel初使用)_Java

前言

在我们项目的开发中啊，前端有时候会传送 excel 文件给后端（java）去解析，那我们作为后端该如何实现对 excel 文件的解析和数据读取呢？说到这我就不得不推荐 easyexcel 了！

easyexcel 介绍

引用下官方对于 easyexcel 介绍：easyexcel是一个基于java的、快速、简洁、解决大文件内存溢出的excel处理工具。他能让你在不用考虑性能、内存的等因素的情况下，快速完成excel的读、写等功能。

官方网址：easyexcel官方文档 - 基于java的excel处理工具 | easy excel

快速上手 easyexcel

前置工作

先创建一个 spring boot 工程，并在 pom.xml 文件添加 easyexcel 和 lombok 依赖。

        <dependency>
            <groupid>org.projectlombok</groupid>
            <artifactid>lombok</artifactid>
            <optional>true</optional>
        </dependency>
        <dependency>
            <groupid>com.alibaba</groupid>
            <artifactid>easyexcel</artifactid>
            <version>3.1.1</version>
        </dependency>

知道表头

如果我们知道 excel 数据的表头，即每列数据的类型包括有多少列时就可以用此方法读取 excel 文件数据。

我们以下图数据为例，对改 excel 中的数据进行获取和处理。

方法一：

首先我们创建一个名为 exceldata 的 java 对象，共有两个属性，分别是 date（日期列数据）和 usenum（用户列数据），每个属性对应 excel 每列某一行中的数据。那么很显而易见，每一行的数据就是一个 exceldata 对象，所有行的数据合起来就是一个泛型为 exceldata 的 exceldata 的集合。

@data
public class exceldata implements serializable {
    /**
     * 对应表格的日期列
     */
    private string date;
    /**
     * 对应表格的用户数列
     */
    private integer usernum;
}

随后编写一个测试类，并在其中编写测试方法。

easyexcel 的 read 方法有很多中构造方法，其中 class head 就是表头类型，传入它还要传入 readlistener 监听器，以便在去读取每行数据时做些自定义操作。我们直接传入它的实现类实例，因为 pagereadlistener 支持逐页读取数据，通过读取指定行数的数据保证占用更少的内存。

话不多说直接上代码：

    /**
     * 知道表头，并形成映射关系
     */
    @test
    public void doimportsformapping() throws filenotfoundexception{
        // 读取 resource 目录下的 excel 文件（网站数据.xlsx）
        file file = resourceutils.getfile("classpath:网站数据.xlsx");
        // 创建一个 list 存储每行的数据，即 exceldata 对象
        list<exceldata> list = new arraylist<>();
        // 直接使用 easyexcel 的 read 方法，同时定义表头的类型，以便将列中数据映射为 exceldata 对象
        easyexcel.read(file, exceldata.class, new pagereadlistener<exceldata>(datalist -> {
            // 并且每行数据，并将其 add 至 list 中
            for (exceldata exceldata : datalist) {
                if (exceldata != null) {
                    list.add(exceldata);
                }
            }
        })).exceltype(exceltypeenum.xlsx).sheet().doread(); // 指定 excel 的文件后缀，开始分析读取
        for (exceldata exceldata : list) {
            system.out.println(exceldata.getdate() + "," + exceldata.getusernum());
        }
    }

执行结果：

方法二：

方法一是直接一次性读取 excel 中的数据，缺少要读取的数据行数和一些自定义操作，所以我们在这里对上面的代码增强一下。

在此方法中我们通过匿名内部类的方式实现 readlistenser 接口，无需额外写一个类去实现 readlistener了。我们设置了一个临时存储的列表（大小为 2），当每次读取的数据（执行 invoke 方法）添加到临时存储表中。当其长度超过 2 时进行全部删除，在删除前我们可以将临时存储的列表存到数据库中，或进行一些其他的自定义操作。

doafterallanalysed 方法是分析并获取所有的数据后会执行的一个方法，我们可以在其中打上日志，表示 excel 所有数据已存入数据库中。

 /**
     * 知道表头，并形成映射关系
     * @throws filenotfoundexception
     */
    @test
    public void doimportsformappingbyinnerclass() throws filenotfoundexception{
        file file = resourceutils.getfile("classpath:网站数据.xlsx");
        easyexcel.read(file, exceldata.class, new readlistener<exceldata>() {

            // 单次缓存的数据量
            public static final int batch_count = 2;

            // 临时存储的列表
            private list<exceldata> cacheddatalist = listutils.newarraylistwithexpectedsize(batch_count);
            @override
            public void invoke(exceldata exceldata, analysiscontext analysiscontext) {
                cacheddatalist.add(exceldata);
                getdata(exceldata);
                if (cacheddatalist.size() >= batch_count) {
                    cacheddatalist = listutils.newarraylistwithexpectedsize(batch_count);
                }
            }

            @override
            public void doafterallanalysed(analysiscontext analysiscontext) {
                system.out.println("存储数据库成功");
            }

            private void getdata(exceldata exceldata) {
                system.out.println(exceldata.getdate() + "," + exceldata.getusernum());
            }
        }).exceltype(exceltypeenum.xlsx).sheet().doread();

    }

执行结果：

不知道表头

方法三：

上面的两种方法都是我们知道表头，包括列的类型和列数量的情况下对 excel 文件进行数据获取的。那我们不知道表头信息，又该如何操作呢？

我们依赖利用 easyexcel 的 read 方法，和前面的步骤大差不差，只不过这次参数少了，如果你还要获取表头即表格的第一行数据，还可通过 headrownumber 方法指定首行编号为 0。

此时返回的是一个 list<map<integer, string>> 集合，其中 map 的键对应表格的列编号（从 0 开始），值就是对应某一行某一列的值，list 的索引代表某一行的数据。调用 map 对象的 values() 方法即可直接获取某一行数据的集合，list<map<integer, string>> 就是所有行数据的集合。我们这说可能不太直观，我把它打印出来给你们看就很简单明了了。

[{0=日期, 1=用户数}, {0=1号, 1=10}, {0=2号, 1=20}, {0=3号, 1=30}, {0=4号, 1=70}, {0=5号, 1=20}, {0=6号, 1=29}, {0=7号, 1=24}, {0=8号, 1=31}, {0=9号, 1=40}, {0=10号, 1=38}, {0=11号, 1=43}]

代码如下：

    @test
    public void doimport() throws filenotfoundexception {
        list<map<integer, string>> list = null;
        file file = resourceutils.getfile("classpath:网站数据.xlsx");
        try {
            list = easyexcel.read(file)
                    .exceltype(exceltypeenum.xlsx)
                    .sheet()
                    .headrownumber(0)
                    .doreadsync();
        } catch (exception e) {
            throw new runtimeexception("读取 excel 文件失败");
        }
        stringbuilder stringbuilder = new stringbuilder();
        for (int i=0;i<list.size();i++) {
            // 转为 linkedhashmap 主要是为了保证读取的数据和表格顺序一致
            linkedhashmap<integer, string> linkedhashmap = (linkedhashmap) list.get(i);
            list<string> datalist = linkedhashmap.values().stream()
                    .filter(objectutils::isnotempty).collect(collectors.tolist());
            stringbuilder.append(stringutils.join(datalist, ",")).append("\n");
        }
        system.out.println(stringbuilder.tostring());
    }

执行结果：