当前位置：日志文章 > 详细内容

使用Python处理CSV文件的全面指南

2025年07月30日 • Python •

常见问题及解决方案问题：文件编码错误解决方案：使用 encoding 参数指定文件编码，例如 encoding='utf-8'。问题：读取大文件时内存不足解决方案：使用 chunksi

常见问题及解决方案

问题：文件编码错误
解决方案：使用 encoding 参数指定文件编码，例如 encoding='utf-8'。

问题：读取大文件时内存不足
解决方案：使用 chunksize 参数逐块读取数据：

for chunk in pd.read_csv('large_data.csv', chunksize=1000):
    process(chunk)  # 自定义处理函数

问题执行脚本报错

ps d:\bsop\zhijianaiweb> & d:/python/python39/python.exe c:/users/wangzq/desktop/csv.py
traceback (most recent call last):
  file "c:\users\wangzq\desktop\csv.py", line 1, in <module>
    import csv
  file "c:\users\wangzq\desktop\csv.py", line 4, in <module>
    writer = csv.writer(file)
attributeerror: partially initialized module 'csv' has no attribute 'writer' (most likely due to a circular import)
ps d:\bsop\zhijianaiweb>

这个错误通常脚本文件命名为 csv.py，导致 python 试图从你的脚本中导入 csv 模块，而不是标准库中的 csv 模块。解决方法如下：

重命名你的脚本：将 csv.py 更改为其他名字，例如 csv_example.py。
删除 csv.pyc 文件（如果存在）：在同一目录下查找 __pycache__ 文件夹，删除其中的 csv.cpython-39.pyc 文件。

使用 python 处理 csv 文件：全面指南

csv（comma-separated values）格式是一种广泛使用的数据交换格式，因其简单易懂而受到青睐。本文将介绍如何使用 python 处理 csv 文件，包括读取、写入、数据处理以及常用库的比较。

csv 文件的基本概念

csv 文件使用逗号分隔值，通常用于存储表格数据。每行代表一条记录，字段由逗号分隔。

使用内置 csv 模块

python 提供了内置的 csv 模块，方便读取和写入 csv 文件。

写入 csv 文件：

import csv
with open('output.csv', mode='w', newline='') as file:
    writer = csv.writer(file)
    writer.writerow(['name', 'age'])
    writer.writerow(['alice', 30])

读取 csv 文件：

import csv

with open('data.csv', mode='r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

使用 pandas 库

pandas 是一个强大的数据处理库，适合进行复杂的数据分析。

读取 csv 文件：

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())

数据处理：可以轻松地进行数据过滤、修改和聚合。

# 过滤年龄大于25的人
filtered_df = df[df['age'] > 25]
print(filtered_df)

# 统计年龄的平均值
average_age = df['age'].mean()
print(f"average age: {average_age}")

写入 csv 文件：

df.to_csv('filtered_output.csv', index=false)

处理缺失值

处理数据时，缺失值是常见问题。可以使用 fillna() 方法填充缺失值：

# 用0填充缺失值
df.fillna(0, inplace=true)

# 删除含有缺失值的行
df.dropna(inplace=true)

使用 dictreader 和 dictwriter

csv 模块还支持将 csv 文件读取为字典格式，方便处理。

读取为字典：

import csv
with open('data.csv', mode='r') as file:
    reader = csv.dictreader(file)
    for row in reader:
        print(row['name'], row['age'])

写入字典：

import csv
with open('output.csv', mode='w', newline='') as file:
    fieldnames = ['name', 'age']
    writer = csv.dictwriter(file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'name': 'bob', 'age': 22})

案例分析

假设我们有一个包含员工信息的 csv 文件 employees.csv，我们想要进行数据分析，比如找出薪水高于某个值的员工，并计算他们的平均薪水。

import pandas as pd

# 读取数据
df = pd.read_csv('employees.csv')

# 过滤薪水大于50000的员工
high_salary_df = df[df['salary'] > 50000]

# 计算平均薪水
average_salary = high_salary_df['salary'].mean()
print(f"average salary of high earners: {average_salary}")

最佳实践

始终检查数据的完整性：读取数据后，检查缺失值和异常值。
使用相对路径：为保证代码的可移植性，使用相对路径读取文件。
文件格式：尽量确保 csv 文件的格式统一，避免出现不同的分隔符或编码问题。

性能比较

在处理大型 csv 文件时，选择合适的库至关重要。csv 模块相对轻量，更适合简单读取和写入，而 pandas 提供了更丰富的数据操作功能，适合进行复杂分析。

结论

无论是使用内置的 csv 模块还是功能强大的 pandas 库，python 都为处理 csv 文件提供了灵活的解决方案。根据具体需求选择合适的方法，可以使数据处理更高效。

以上就是使用python处理csv文件的全面指南的详细内容，更多关于python处理csv文件的资料请关注代码网其它相关文章！

点击排行

江湖微商城究竟有什么用?四个场景帮你解析

docker进阶教程之dockerfile优化镜像大小

颜值逆天不足7500元锐龙5-2600配GTX1066白色主机推荐

ipados16.2更新了什么？ipados16.2更新内容介绍

mx450显卡相当于GTX什么级别 mx450显卡性能一览

GDDR6X和GDDR6区别是什么 GDDR6X和GDDR6对比介绍

Mac新手:如何让电脑每隔一段时间为你报时?

荣耀平板7怎么样荣耀平板7详细评测

什么是等离子显示器及其成像原理、工作原理介绍

MySQL8.0新特性之不可见主键的使用