在处理excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作。然而,当面对大量 excel 文件或结构复杂的数据表格时,手动处理这些任务不仅效率低下,还容易因操作失误造成数据错误。
使用 python脚本,可以实现对 excel 表格的高效自动化处理。无论是删除指定的行或列、批量清除空白行和空白列,还是根据关键字筛选并删除包含特定数据的单元格,这些操作都可以通过脚本一次性完成,大幅提升工作效率和准确性。
本文将详细介绍如何使用 python 删除 excel 中的行、列和单元格,内容涵盖以下几个方面:
- 开发环境准备
- 使用 python 删除 excel 表格中的行
- 删除特定行
- 删除空白行
- 删除含指定数据的行
- 使用 python 删除 excel 表格中的列
- 删除特定列
- 删除空白列
- 删除含指定数据的列
- 使用 python 删除 excel 中的单元格并自动移动剩余内容
- 删除特定单元格
- 删除空白单元格
- 删除含指定数据的单元格
开发环境准备
在操作 excel 文件之前,首先需要准备好 python 开发环境,并引入相应的库。本文将使用第三方库 spire.xls for python,它支持读取、修改、写入以及转换 excel 文件,且不依赖微软office或其他第三方软件。
安装 spire.xls
spire.xls 提供了两个版本,可以根据需求选择合适的版本:
社区版:免费使用,但每个 .xls 文件限制为 200 行和 5 个工作表(.xlsx 文件没有此限制)。安装命令:
pip install spire.xls.free
商业版:功能完备,但会添加水印。可以在 [这里] 申请免费的测试许可证。
安装命令:
pip install spire.xls
安装完成后,即可在python应用程序中调用该库的api。
使用 python 删除 excel 表格中的行
删除特定行
如果你已知需要删除的行号,可以使用worksheet.deleterow(rowindex: int, rowcount: int) 方法,通过指定起始行号和删除行数,直接移除一行或多行数据。这种方式适用于结构固定或需要批量删除指定位置行的 excel 表格。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 调用 deleterow() 方法删除指定行。
- 保存修改后的文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 从第 5 行开始删除 2 行 worksheet.deleterow(5, 2) # 保存结果文件 workbook.savetofile("删除特定行.xlsx", excelversion.version2016) workbook.dispose()
删除空白行
在处理 excel 表格时,空白行会影响数据的完整性和可读性。使用 worksheet.rows[index].isblank 属性,可以轻松判断某一行是否为空。若返回值为 true,则说明该行为空白行,可使用 deleterow() 方法将其删除。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 倒序遍历所有行,使用 isblank 属性判断其是否为空。
- 对空白行调用 deleterow() 方法进行删除。
- 保存修改后的 excel 文件。
实现代码:
from spire.xls import * from spire.xls.common import * # 创建 workbook 实例 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 sheet = workbook.worksheets[0] # 删除空白行(倒序遍历避免索引错误) for i in range(sheet.rows.length - 1, -1, -1): if sheet.rows[i].isblank: sheet.deleterow(i + 1) # 保存结果文件 workbook.savetofile("删除空白行", excelversion.version2013) workbook.dispose()
删除含指定数据的行
当需要删除某些包含特定关键词(如“已取消”、“无效”)的行时,可通过worksheet.findall()方法查找关键词所在的单元格并获取其所在行,再使用deleterow()方法删除这些行。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 使用 findall() 方法查找包含指定内容的所有单元格。
- 提取这些单元格所在的行索引,并去重。
- 倒序遍历行索引并使用deleterow()方法逐行删除。
- 保存处理后的文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 查找包含特定值的单元格 ranges = worksheet.findall("已取消", findtype.text, excelfindoptions.matchentirecellcontent) # 存储行索引 row_indexes = [] # 遍历查找到的单元格 for range in ranges: row_index = range.row if row_index not in row_indexes: row_indexes.append(row_index) # 倒序排列行索引 row_indexes.sort(reverse=true) # 逐行删除 for row_index in row_indexes: worksheet.deleterow(row_index) # 保存结果文件 workbook.savetofile("删除含特定数据的行.xlsx", excelversion.version2016) workbook.dispose()
使用 python 删除 excel 表格中的列
删除特定列
若已明确某些列不再需要,可通过使用worksheet.deletecolumn(columnindex: int, columncount: int) 方法,删除一列或多列。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 使用 deletecolumn() 方法,从工作表中删除指定列。
- 保存修改后的文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 从第 3 列开始删除 2 列 worksheet.deletecolumn(3, 2) # 保存结果文件 workbook.savetofile("删除特定列.xlsx", excelversion.version2016) workbook.dispose()
删除空白列
空白列在 excel 表格中同样会造成数据干扰。使用 worksheet.columns[index].isblank 属性可以检测列是否为空,若返回值为 true,即可调用 deletecolumn() 方法删除该列。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 倒序遍历所有列,使用isblank属性判断其是否为空。
- 若为空,则调用 deletecolumn() 方法进行删除。
- 保存修改后的文件。
实现代码:
from spire.xls import * from spire.xls.common import * # 创建 workbook 实例 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 sheet = workbook.worksheets[0] # 删除空白列(倒序遍历避免索引混乱) for i in range(sheet.columns.length - 1, -1, -1): if sheet.columns[i].isblank: sheet.deletecolumn(i + 1) # 保存结果文件 workbook.savetofile("删除空白列.xlsx", excelversion.version2013) workbook.dispose()
删除含指定数据的列
如果你需要删除包含某个特定值的整列数据,比如含有“测试”的列,可以使用worksheet.findall()方法查找数据,获取其所在单元格,获取该单元格所在列,再调用 deletecolumn() 方法删除对应列。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 使用 findall() 方法查找包含指定文本的单元格;
- 提取这些单元格所在的列索引,并去重;
- 倒序遍历列索引并使用deletecolumn()方法逐列删除;
- 保存文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 查找包含指定值的单元格 ranges = worksheet.findall("测试", findtype.text, excelfindoptions.matchentirecellcontent) # 存储列索引 col_indexes = [] # 遍历查找到的单元格 for range in ranges: col_index = range.column if col_index not in col_indexes: col_indexes.append(col_index) # 倒序排列列索引 col_indexes.sort(reverse=true) # 逐列删除 for col_index in col_indexes: worksheet.deletecolumn(col_index) # 保存结果文件 workbook.savetofile("删除含指定数据的列.xlsx", excelversion.version2016) workbook.dispose()
使用 python 删除 excel 中的单元格并自动移动剩余内容
删除特定单元格
相较于整行整列的删除,删除单元格更常用于局部调整。例如在数据导入后,可能存在个别无效单元格需要清除,并将其他数据自动移位填充。
使用worksheet.deleterange()方法,可以轻松移除不需要的单元格或单元格范围,并指定剩余内容的移动方向,例如deleteoption.moveleft,表示将剩余单元格内容向左移。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 获取目标区域的单元格范围。
- 调用 deleterange() 方法删除该单元格范围并设置剩余内容的移动方向;
- 保存修改后的文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 通过指定起始行、起始列、结束行和结束列确定要删除的单元格范围(也可以使用范围名称如 "a2:b3") range_to_delete = worksheet.range[2, 1, 3, 2] # 删除该区域,并将其右侧单元格左移 worksheet.deleterange(range_to_delete, deleteoption.moveleft) # 保存结果文件 workbook.savetofile("删除特定单元格.xlsx", excelversion.version2016) workbook.dispose()
删除空白单元格
空白单元格可能导致数据排列不整齐或计算错误。可以使用 worksheet.cells[index].isblank 属性逐个检测单元格是否为空,然后使用 deleterange() 删除它并设置剩余数据的移动方向。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 遍历工作表中的所有单元格。
- 使用isblank属性判断其是否为空。
- 若为空则使用 deleterange() 删除它并设置其右侧剩余数据的移动方向。
- 保存结果文件。
示例代码:
from spire.xls import * from spire.xls.common import * # 创建 workbook 实例 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 sheet = workbook.worksheets[0] # 删除空白单元格(倒序遍历避免索引问题) for i in range(sheet.cells.length - 1, -1, -1): if sheet.cells[i].isblank: sheet.deleterange(sheet.cells[i], deleteoption.moveleft) # 保存结果文件 workbook.savetofile("删除空白单元格.xlsx", excelversion.version2013) workbook.dispose()
删除含指定数据的单元格
如果需要删除表格中包含特定内容的单元格,可以使用workbook.findall()方法查找这些单元格,然后使用 deleterange() 删除这些单元格并设置剩余数据的移动方向。
实现步骤:
- 创建 workbook 对象并加载 excel 文件。
- 获取目标工作表。
- 使用 workbook.findall() 方法查找包含指定内容的单元格。
- 遍历这些单元格,调用 deleterange() 删除它们并移动剩余内容。
- 保存修改后的文件。
实现代码:
from spire.xls.common import * from spire.xls import * # 创建 workbook 对象 workbook = workbook() # 加载 excel 文件 workbook.loadfromfile("测试.xlsx") # 获取第一个工作表 worksheet = workbook.worksheets[0] # 查找包含指定值的所有单元格 ranges = worksheet.findall("测试", findtype.text, excelfindoptions.matchentirecellcontent) # 逐个删除这些单元格,并将右侧单元格左移 for range in ranges: worksheet.deleterange(range, deleteoption.moveleft) # 保存结果文件 workbook.savetofile("删除含特定数据的单元格.xlsx", excelversion.version2016) workbook.dispose()
到此这篇关于使用python删除excel中的行列和单元格示例详解的文章就介绍到这了,更多相关python删除excel内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论