当前位置: 代码网 > it编程>前端脚本>Python > Python实现读取Excel表数据并转为JSON格式文件

Python实现读取Excel表数据并转为JSON格式文件

2025年04月20日 Python 我要评论
python读取excel表格数据并写成json格式文件(精简版)1. 步骤步骤 1: 安装必要的库确保你已经安装了pandas和openpyxl(用于读取excel文件)。你可以使用pip来安装这些

python读取excel表格数据并写成json格式文件(精简版)

1. 步骤

步骤 1: 安装必要的库

确保你已经安装了pandas和openpyxl(用于读取excel文件)。你可以使用pip来安装这些库:

pip install pandas openpyxl

步骤 2: 读取excel文件

使用pandas的read_excel函数来读取excel文件。

步骤 3: 将数据转换为json格式

使用pandas的to_json方法将dataframe转换为json格式。

步骤 4: 保存json文件

将转换后的json数据写入到文件中。

2. 示例代码

代码如下

import pandas as pd
 
# 步骤 2: 读取excel文件
file_path = 'path_to_your_excel_file.xlsx'  # 替换为你的excel文件路径
df = pd.read_excel(file_path)
 
# 步骤 3: 将dataframe转换为json格式
# orient参数可以控制json的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。
# 这里使用'records'格式,它会将每一行数据作为一个对象。
json_data = df.to_json(orient='records')
 
# 步骤 4: 保存json文件
output_file_path = 'output.json'  # 指定输出json文件的路径和名称
with open(output_file_path, 'w', encoding='utf-8') as f:
    f.write(json_data)
 
print("excel数据已成功转换为json并保存到文件。")

3. 注意事项

确保你的excel文件路径是正确的。

根据你的需求选择合适的orient参数值。例如,如果你想要将列作为json对象的键,可以使用orient=‘columns’。不同的选项会影响json的结构。

使用encoding='utf-8’确保在写入文件时正确处理unicode字符。

这样,你就可以将excel表格数据读取并保存为json格式的文件了。

python读取excel表数据转为json格式文件(详细优化版)

1.详细优化部分

该部分以上面精简代码为基础进行优化改造

1.1 下载pandas

使用pip命令下载pandas库

pip install pandas openpyxl

1.2 读取表格文件(可指定sheet页)

读取excel文件,可加参数sheet_name="sheet名称"来指定sheet页,如果不指定,默认第一个sheet页

如想要读取的名称为sheet2

df = pd.read_excel(file_path, sheet_name='sheet2')

1.3 库日期处理

由于表格中日期转换为json后变成了一串数字,如何解决这个问题,可使用to_datetime函数

# 假设日期列名为'date',且数据类型为整数(excel序列号)
df['date'] = pd.to_datetime(df['date'], origin='unix', unit='d')  # 将excel序列号转换为datetime对象
df['date'] = df['date'].dt.strftime('%y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'

1.4 布尔值转换

表格中的true和false转换时不会做处理,单如果json后续要导入到mysql表中,mysql表识别true和false会导入失败,只能识别0和1
可以使用以下代码将true和false转为1和0

# 修改表中的boolean值,满足表中要求的0-1,而不是false true,不然导入报错
df['是否加装急停开关'] = df['是否加装急停开关'].map({true: 1, false: 0})

1.5 空值na的处理

如果出现了空值,可使用fillna函数替换,如下

# 将na替换为空字符
df = df.fillna('')

1.6 列名替换

如果想修改读取到的列名称,可使用以下代码将列名修改值

如excel表中列名是中文,为了更方便导入mysql表,这里将中文列名修改为对应的表字段(非表中字段,而是小驼峰)

column_map ={
    '任务单编号': 'taskticketid',
        '工号': 'employeeid'
        }

print(df.columns)
col_names = df.columns.to_list()
col_names = [column_map[s] for s in col_names]
print(col_names)
df.columns = col_names

2. 详细优化后的完整代码

完整代码如下

# 步骤 1:引入pandas库
import pandas as pd
 
# 步骤 2: 读取excel文件
# file_path = 'path_to_your_excel_file.xlsx'  # 替换为你的excel文件路径
file_path = '车辆改造单数据库.xlsm'  # 替换为你的excel文件路径
df = pd.read_excel(file_path, sheet_name='sheet2')
# print(df)


# 假设日期列名为'date',且数据类型为整数(excel序列号)
# df['date'] = pd.to_datetime(df['date'], origin='unix', unit='d')  # 将excel序列号转换为datetime对象
# df['date'] = df['date'].dt.strftime('%y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'

list = ['创建日期','样品送达日期','要求完成日期','实际完成日期']

for i in list:
    df[i] = pd.to_datetime(df[i], origin='unix', unit='d')  # 将excel序列号转换为datetime对象
    df[i] = df[i].dt.strftime('%y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'


# df['创建日期'] = pd.to_datetime(df['创建日期'], origin='unix', unit='d')  # 将excel序列号转换为datetime对象
# df['创建日期'] = df['创建日期'].dt.strftime('%y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'
 

print(df['是否加装急停开关'])
# 修改表中的boolean值,满足表中要求的0-1,而不是false true,不然导入报错
df['是否加装急停开关'] = df['是否加装急停开关'].map({true: 1, false: 0})

# df = df.fillna('')

column_map ={
    '任务单编号': 'taskticketid',
'工号': 'employeeid',
'委托人': 'requester',
'创建日期': 'creationdate',
'样品送达日期': 'sampledeliverydate',
'要求完成日期': 'requiredcompletiondate',
'实际完成日期': 'completiondate'
}

print(df.columns)
col_names = df.columns.to_list()
col_names = [column_map[s] for s in col_names]
print(col_names)
df.columns = col_names

# 步骤 3: 将dataframe转换为json格式
# orient参数可以控制json的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。
# 这里使用'records'格式,它会将每一行数据作为一个对象。orient='records'确保json输出为记录列表。
# force_ascii=false确保输出的json中包含非ascii字符,例如中文。
# date_format='iso'确保日期以iso格式输出。如果你需要其他日期格式,可以相应调整或去掉此参数。
json_data = df.to_json(orient='records', indent=4, force_ascii=false, date_format='iso',)
 
# 步骤 4: 保存json文件
# output_file_path = 'output.json'  # 指定输出json文件的路径和名称
output_file_path = '车辆改造单数据库.json'  # 指定输出json文件的路径和名称

with open(output_file_path, 'w', encoding='utf-8') as f:
    f.write(json_data)
 
print("excel数据已成功转换为json并保存到文件。")

以上就是python实现读取excel表数据并转为json格式文件的详细内容,更多关于python读取excel并转为json的资料请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com