当前位置: 代码网 > it编程>前端脚本>Python > Python实现批量提取Excel数据

Python实现批量提取Excel数据

2024年12月18日 Python 我要评论
在数据处理和分析的过程中,excel 是一种广泛使用的数据存储格式。使用 python 可以高效地从多个 excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpy

在数据处理和分析的过程中,excel 是一种广泛使用的数据存储格式。使用 python 可以高效地从多个 excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 excel 数据

pandas 是一个强大的数据分析库,它提供了直接读取和处理 excel 文件的功能。

1. 安装 pandas

首先,确保已安装 pandas 和 openpyxl:

pip install pandas openpyxl

2. 读取单个 excel 文件

import pandas as pd

# 读取 excel 文件
df = pd.read_excel('data.xlsx')

# 显示前几行数据
print(df.head())

3. 批量读取多个 excel 文件

假设有多个 excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

import os

# 存放 excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 dataframe
all_data = pd.dataframe()

# 逐个读取并合并
for file in file_list:
    df = pd.read_excel(file)
    all_data = all_data.append(df, ignore_index=true)

# 显示合并后的数据
print(all_data.head())

使用 openpyxl 批量提取 excel 数据

openpyxl 是一个专门处理 excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

pip install openpyxl

2. 读取单个 excel 文件

from openpyxl import load_workbook

# 加载 excel 文件
wb = load_workbook('data.xlsx')

# 选择活动工作表
ws = wb.active

# 读取所有数据
data = []
for row in ws.iter_rows(values_only=true):
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 excel 文件

import os
from openpyxl import load_workbook

# 存放 excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    wb = load_workbook(file)
    ws = wb.active
    for row in ws.iter_rows(values_only=true):
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

使用 xlrd 批量提取 excel 数据

xlrd 是一个用于读取 excel 文件的库,适用于 .xls 和 .xlsx 格式的文件。

1. 安装 xlrd

pip install xlrd

2. 读取单个 excel 文件

import xlrd

# 打开 excel 文件
workbook = xlrd.open_workbook('data.xls')

# 选择工作表
sheet = workbook.sheet_by_index(0)

# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 excel 文件

import os
import xlrd

# 存放 excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    workbook = xlrd.open_workbook(file)
    sheet = workbook.sheet_by_index(0)
    for row_idx in range(sheet.nrows):
        row = sheet.row_values(row_idx)
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

总结

本文详细介绍了如何使用 pandas、openpyxl 和 xlrd 三种库批量提取 excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 excel 数据。

到此这篇关于python实现批量提取excel数据的文章就介绍到这了,更多相关python批量提取excel数据内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com