当前位置: 代码网 > it编程>编程语言>Php > PHP如何使用XlsWriter实现百万级数据导入导出

PHP如何使用XlsWriter实现百万级数据导入导出

2025年04月24日 Php 我要评论
在php中使用 xlswriter(如 xlswriter 扩展)处理百万级数据的导入导出,需重点解决内存占用和性能问题。以下是分步骤的实现方案:一、环境准备1 安装 xlswriter 扩展从pec

在php中使用 xlswriter(如 xlswriter 扩展)处理百万级数据的导入导出,需重点解决内存占用和性能问题。

以下是分步骤的实现方案:

一、环境准备

1 安装 xlswriter 扩展

从pecl安装:

pecl install xlswriter

在 php.ini 中启用扩展:

extension=xlswriter.so

2 调整php配置

处理大数据时需增加内存和执行时间限制:

memory_limit = 1024m
max_execution_time = 3600

二、百万级数据导出(excel)

核心思路

流式写入:避免一次性加载所有数据到内存。

分页查询:从数据库分批读取数据。

直接输出到浏览器:减少临时文件占用。

代码实现

<?php
// 1. 初始化excel对象
$config = ['path' => '/tmp']; // 临时目录(可选)
$excel = new \vtiful\kernel\excel($config);
$file = $excel->filename('export.xlsx')->header(['id', 'name', 'email']);
 
// 2. 设置http头直接下载
header('content-type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet');
header('content-disposition: attachment;filename="export.xlsx"');
header('cache-control: max-age=0');
$file->output();
 
// 3. 连接数据库
$pdo = new pdo('mysql:host=localhost;dbname=test', 'user', 'password');
 
// 4. 分页查询并写入数据
$pagesize = 10000; // 每页数据量
$page = 1;
do {
    $offset = ($page - 1) * $pagesize;
    $stmt = $pdo->prepare("select id, name, email from users limit :offset, :limit");
    $stmt->bindvalue(':offset', $offset, pdo::param_int);
    $stmt->bindvalue(':limit', $pagesize, pdo::param_int);
    $stmt->execute();
    $data = $stmt->fetchall(pdo::fetch_assoc);
 
    if (empty($data)) {
        break;
    }
 
    // 写入当前页数据
    foreach ($data as $row) {
        $file->data([$row['id'], $row['name'], $row['email']]);
    }
 
    $page++;
    ob_flush(); // 刷新输出缓冲区
    flush();
} while (true);
 
// 5. 结束写入
$file->output();

关键点

分页查询:通过 limit 分批拉取数据,避免一次性加载百万数据。

流式输出:直接输出到浏览器,减少内存占用。

缓冲区刷新:使用 ob_flush() 和 flush() 实时推送数据到客户端。

三、百万级数据导入(excel到数据库)

核心思路

分块读取excel:避免一次性加载整个文件。

批量插入:使用事务和批量sql减少数据库操作次数。

错误处理:记录错误数据,避免单条失败导致全部回滚。

代码实现

<?php
// 1. 上传文件处理
$uploadfile = $_files['file']['tmp_name'];
if (!is_uploaded_file($uploadfile)) {
    die('非法文件');
}
 
// 2. 初始化excel读取器
$excel = new \vtiful\kernel\excel();
$excel->openfile($uploadfile);
$sheet = $excel->getsheet();
 
// 3. 连接数据库
$pdo = new pdo('mysql:host=localhost;dbname=test', 'user', 'password');
$pdo->begintransaction();
 
// 4. 分块读取并插入
$batchsize = 5000; // 每批插入量
$batchdata = [];
$currentrow = 0;
 
try {
    while ($row = $sheet->nextrow()) {
        $currentrow++;
        if ($currentrow === 1) {
            continue; // 跳过标题行
        }
 
        // 数据校验(示例)
        if (empty($row[1]) || !filter_var($row[2], filter_validate_email)) {
            error_log("invalid data at row $currentrow: " . json_encode($row));
            continue;
        }
 
        // 构建批量插入数据
        $batchdata[] = [
            'id' => $row[0],
            'name' => $row[1],
            'email' => $row[2]
        ];
 
        // 批量插入
        if (count($batchdata) >= $batchsize) {
            insertbatch($pdo, $batchdata);
            $batchdata = [];
        }
    }
 
    // 插入剩余数据
    if (!empty($batchdata)) {
        insertbatch($pdo, $batchdata);
    }
 
    $pdo->commit();
    echo "导入成功!";
} catch (exception $e) {
    $pdo->rollback();
    echo "导入失败: " . $e->getmessage();
}
 
// 批量插入函数
function insertbatch($pdo, $data) {
    $sql = "insert into users (id, name, email) values ";
    $values = [];
    $placeholders = [];
    foreach ($data as $item) {
        $values[] = $item['id'];
        $values[] = $item['name'];
        $values[] = $item['email'];
        $placeholders[] = '(?, ?, ?)';
    }
    $sql .= implode(', ', $placeholders);
    $stmt = $pdo->prepare($sql);
    $stmt->execute($values);
}

关键点

分块读取:逐行读取excel,避免内存爆炸。

事务提交:批量插入后提交事务,减少数据库压力。

错误跳过:记录错误行,避免单条数据错误导致整体失败。

四、性能优化技巧

1 索引优化:

在导入前移除索引,导入完成后重新创建。

使用 alter table ... disable keys 和 alter table ... enable keys(myisam引擎)。

2 调整mysql配置:

innodb_buffer_pool_size = 2g
innodb_flush_log_at_trx_commit = 0

3  压缩excel文件:

$file = $excel->filename('export.xlsx')->setcompressionlevel(6);

五、注意事项

内存监控:使用 memory_get_usage() 实时监控内存。

超时处理:通过 set_time_limit(0) 禁用脚本超时。

日志记录:记录导入导出的进度和错误。

到此这篇关于php如何使用xlswriter实现百万级数据导入导出的文章就介绍到这了,更多相关php xlswriter数据导入导出内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com