python读取excel表格数据并写成json格式文件(精简版)
1. 步骤
步骤 1: 安装必要的库
确保你已经安装了pandas和openpyxl(用于读取excel文件)。你可以使用pip来安装这些库:
pip install pandas openpyxl
步骤 2: 读取excel文件
使用pandas的read_excel函数来读取excel文件。
步骤 3: 将数据转换为json格式
使用pandas的to_json方法将dataframe转换为json格式。
步骤 4: 保存json文件
将转换后的json数据写入到文件中。
2. 示例代码
代码如下
import pandas as pd # 步骤 2: 读取excel文件 file_path = 'path_to_your_excel_file.xlsx' # 替换为你的excel文件路径 df = pd.read_excel(file_path) # 步骤 3: 将dataframe转换为json格式 # orient参数可以控制json的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。 # 这里使用'records'格式,它会将每一行数据作为一个对象。 json_data = df.to_json(orient='records') # 步骤 4: 保存json文件 output_file_path = 'output.json' # 指定输出json文件的路径和名称 with open(output_file_path, 'w', encoding='utf-8') as f: f.write(json_data) print("excel数据已成功转换为json并保存到文件。")
3. 注意事项
确保你的excel文件路径是正确的。
根据你的需求选择合适的orient参数值。例如,如果你想要将列作为json对象的键,可以使用orient=‘columns’。不同的选项会影响json的结构。
使用encoding='utf-8’确保在写入文件时正确处理unicode字符。
这样,你就可以将excel表格数据读取并保存为json格式的文件了。
python读取excel表数据转为json格式文件(详细优化版)
1.详细优化部分
该部分以上面精简代码为基础进行优化改造
1.1 下载pandas
使用pip命令下载pandas库
pip install pandas openpyxl
1.2 读取表格文件(可指定sheet页)
读取excel文件,可加参数sheet_name="sheet名称"来指定sheet页,如果不指定,默认第一个sheet页
如想要读取的名称为sheet2
df = pd.read_excel(file_path, sheet_name='sheet2')
1.3 库日期处理
由于表格中日期转换为json后变成了一串数字,如何解决这个问题,可使用to_datetime函数
# 假设日期列名为'date',且数据类型为整数(excel序列号) df['date'] = pd.to_datetime(df['date'], origin='unix', unit='d') # 将excel序列号转换为datetime对象 df['date'] = df['date'].dt.strftime('%y-%m-%d') # 将datetime对象转换为字符串格式'年-月-日'
1.4 布尔值转换
表格中的true和false转换时不会做处理,单如果json后续要导入到mysql表中,mysql表识别true和false会导入失败,只能识别0和1
可以使用以下代码将true和false转为1和0
# 修改表中的boolean值,满足表中要求的0-1,而不是false true,不然导入报错 df['是否加装急停开关'] = df['是否加装急停开关'].map({true: 1, false: 0})
1.5 空值na的处理
如果出现了空值,可使用fillna函数替换,如下
# 将na替换为空字符 df = df.fillna('')
1.6 列名替换
如果想修改读取到的列名称,可使用以下代码将列名修改值
如excel表中列名是中文,为了更方便导入mysql表,这里将中文列名修改为对应的表字段(非表中字段,而是小驼峰)
column_map ={ '任务单编号': 'taskticketid', '工号': 'employeeid' } print(df.columns) col_names = df.columns.to_list() col_names = [column_map[s] for s in col_names] print(col_names) df.columns = col_names
2. 详细优化后的完整代码
完整代码如下
# 步骤 1:引入pandas库 import pandas as pd # 步骤 2: 读取excel文件 # file_path = 'path_to_your_excel_file.xlsx' # 替换为你的excel文件路径 file_path = '车辆改造单数据库.xlsm' # 替换为你的excel文件路径 df = pd.read_excel(file_path, sheet_name='sheet2') # print(df) # 假设日期列名为'date',且数据类型为整数(excel序列号) # df['date'] = pd.to_datetime(df['date'], origin='unix', unit='d') # 将excel序列号转换为datetime对象 # df['date'] = df['date'].dt.strftime('%y-%m-%d') # 将datetime对象转换为字符串格式'年-月-日' list = ['创建日期','样品送达日期','要求完成日期','实际完成日期'] for i in list: df[i] = pd.to_datetime(df[i], origin='unix', unit='d') # 将excel序列号转换为datetime对象 df[i] = df[i].dt.strftime('%y-%m-%d') # 将datetime对象转换为字符串格式'年-月-日' # df['创建日期'] = pd.to_datetime(df['创建日期'], origin='unix', unit='d') # 将excel序列号转换为datetime对象 # df['创建日期'] = df['创建日期'].dt.strftime('%y-%m-%d') # 将datetime对象转换为字符串格式'年-月-日' print(df['是否加装急停开关']) # 修改表中的boolean值,满足表中要求的0-1,而不是false true,不然导入报错 df['是否加装急停开关'] = df['是否加装急停开关'].map({true: 1, false: 0}) # df = df.fillna('') column_map ={ '任务单编号': 'taskticketid', '工号': 'employeeid', '委托人': 'requester', '创建日期': 'creationdate', '样品送达日期': 'sampledeliverydate', '要求完成日期': 'requiredcompletiondate', '实际完成日期': 'completiondate' } print(df.columns) col_names = df.columns.to_list() col_names = [column_map[s] for s in col_names] print(col_names) df.columns = col_names # 步骤 3: 将dataframe转换为json格式 # orient参数可以控制json的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。 # 这里使用'records'格式,它会将每一行数据作为一个对象。orient='records'确保json输出为记录列表。 # force_ascii=false确保输出的json中包含非ascii字符,例如中文。 # date_format='iso'确保日期以iso格式输出。如果你需要其他日期格式,可以相应调整或去掉此参数。 json_data = df.to_json(orient='records', indent=4, force_ascii=false, date_format='iso',) # 步骤 4: 保存json文件 # output_file_path = 'output.json' # 指定输出json文件的路径和名称 output_file_path = '车辆改造单数据库.json' # 指定输出json文件的路径和名称 with open(output_file_path, 'w', encoding='utf-8') as f: f.write(json_data) print("excel数据已成功转换为json并保存到文件。")
以上就是python实现读取excel表数据并转为json格式文件的详细内容,更多关于python读取excel并转为json的资料请关注代码网其它相关文章!
发表评论