如何将DataFrame数据写入csv文件及读取_Python

一、savedata函数

import csv
 
def savedata(filepath, data):
 
    with open(filepath, 'w+', newline='') as f:
        writer = csv.writer(f)
        for row in data:
            writer.writerow(row)

如果data是一个list，savedata函数会将list中的每个元素保存在csv文件中的一行。

但是存在一个问题：

csv文件中保存的数据如果直接读取出来是str类型，需要进行转换

二、将dataframe写入csv文件

情况1

将list写入csv文件

init_configs = []
for i, cluster in enumerate(clusters):
    init_configs.append([f"cluster {i}:"])
    for _, row in cluster.iterrows():
        config = row.tolist()
        init_configs.append(config)
 
savedata('filepath', init_configs)

config = row.tolist()会将df中每一行数据都转变为list，然后append到init_configs中，通过调用savedata函数可以将每一行数据表示的list都写到csv文件中的一行。

这种情况生成的csv文件中每一行的各个元素之间都是用逗号隔开。

情况2

将嵌套list写入csv文件

init_configs = []
for i, cluster in enumerate(clusters):
    init_configs.append([f"cluster {i}:"])
    for _, row in cluster.iterrows():
        config = row.tolist()
        init_configs.append([config])
 
savedata('filepath', init_configs)

这种情况下init_configs中每个元素是一个二维list，由于csv 文件是一种纯文本格式，它无法直接存储列表或其他复杂的数据结构。

当尝试将 [[1, 2, 3, 4, 5]] 这个二维嵌套list写入csv文件时，它会被自动转换为字符串形式。

如下：

三、读取csv文件

情况1

如果按照上面的方法1写csv文件，可以按照如下方式将内容读出来：

import pandas as pd
 
with open(filepath, 'r') as f:
    lines = f.readlines()
 
filtered_lines = [line for line in lines if not line.startswith('cluster')]
 
configs = []
for line in filtered_lines:
    config = [int(x) for x in line.strip().split(',')]
    configs.append(config)
 
df = pd.dataframe(configs)

可以用列表表达式的方式将csv文件中每一行的数据转为一个list。

情况2

如果将整个list当作字符串写到了csv文件中，可以按照如下方式将内容正确地读出来：

import pandas as pd
import ast
 
with open(filepath, 'r') as f:
    lines = f.readlines()
 
filtered_lines = [line for line in lines if not line.startswith('cluster')]
 
configs = []
for line in filtered_lines:
    config = ast.literal_eval(eval(line))
    configs.append(config)
 
df = pd.dataframe(configs)

通过config = ast.literal_eval(eval(line))可以将变为字符串的list还原成原本的数据形式。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持代码网。

Python numpy二维数组如何删除指定行和列

1.原始数据print('========原始数据==========')x = np.array(np.arange(0, 16).reshape(4, 4)... [阅读全文]

python使用pyplot绘制横轴为时间的图

1. 导入环境import numpy as npimport matplotlib.pyplot as pltfrom ipython import disp... [阅读全文]

Python报错TypeError: unsupported operand的问题分析和解决方法

一、分析问题背景typeerror: unsupported operand 是python中常见的一类错误，通常在尝试对不兼容的数据类型进行操作时发生。比如，... [阅读全文]

Python Web日志管理与监控实践指南

1. 日志记录与配置python标准库logging的基础使用python标准库自带的logging模块是实现日志记录的核心工具。通过灵活的配置，可以记录不同级... [阅读全文]

python base64图片互转,解决base64字符串转PIL图片对象报错:binascii.Error: Incorrect padding问题

base64保存成图片可能会出现: binascii.error: incorrect padding原因：在base64编码中，字符串的长度应该是4的倍数，如... [阅读全文]

python如何对图片或文件的操作

一. base64 与图片的相互转换1. base64 转图片import base64from io import bytesiofrom pil impor... [阅读全文]


验证码：

验证码：

如何将DataFrame数据写入csv文件及读取

2024年09月18日 • Python •我要评论

一、savedata函数

二、将dataframe写入csv文件

情况1

情况2

三、读取csv文件

情况1

情况2

总结

相关文章:

发表评论