Python如何实现读取csv文件时忽略文件的编码格式_Python

1、背景介绍

我们再日常读取csv文件的时候经常会发现csv文件的格式有多种，常见的有【utf-8】\【gbk】\ 【ansi】格式，我们再读取的时候会加上encoding="xx"参数，为了，方便我们可以使用 chardet.detect()检测文件编码。

编码检测：通过chardet自动检测文件编码，确保正确读取文件内容。
异常处理：对可能出现的编码错误进行处理，提供备用的utf-8编码读取方案。
csv处理：使用标准库csv模块读取并打印csv文件内容，包括表头和数据行。

2、库的安装

库	用途	安装
csv	csv文件的读写	内置库无需安装

3、核心代码

①：到的编码格式

def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
         raw_data = f.read()
         result = chardet.detect(raw_data)
         return result['encoding']

②：调用detect_encoding函数获取文件的编码格式

def main():
    file_path = '新建xlsx 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except unicodedecodeerror:
        # 如果检测到的编码格式读取失败，尝试使用 utf-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except exception as e:
            print(f"读取文件时发生错误: {e}")
    except exception as e:
        print(f"读取文件时发生错误: {e}")

4、完整代码

# -*- coding: utf-8 -*-
'''
@project ：测试 
@file    ：test2_read_csv.py
@ide     ：pycharm 
@author  ：一晌小贪欢（278865463@qq.com）
@date    ：2025/3/1 21:40 
'''

import csv
import chardet


def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
        raw_data = f.read()
        result = chardet.detect(raw_data)
        return result['encoding']


def read_csv(file_path, encoding):
    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.reader(f)
        head = next(reader)
        print("表头", head)
        for row in reader:
            print(row)


def main():
    file_path = '新建xlsx 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except unicodedecodeerror:
        # 如果检测到的编码格式读取失败，尝试使用 utf-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except exception as e:
            print(f"读取文件时发生错误: {e}")
    except exception as e:
        print(f"读取文件时发生错误: {e}")


if __name__ == "__main__":
    main()

到此这篇关于python如何实现读取csv文件时忽略文件的编码格式的文章就介绍到这了,更多相关python读取csv内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Python脚本实现定时监控端口

python写了一个监控端口服务，自动重启的脚本为了防止以后找不到代码，特别记录一下import osimport sysimport threadingimp... [阅读全文]

Python requests下载文件的几种常用方法(附代码)

1. 基础下载：import requestsdef download_file(url, save_path): response = requests... [阅读全文]

Python字符串操作strip()和split()方法详解

前言在 python 编程中，strip()和split()是两个非常常用的字符串操作方法，它们能够帮助我们轻松处理和操作字符串数据。理解它们的工作原理，可以让... [阅读全文]

教你用pytorch训练五子棋ai示例代码

有4个文件game.py 五子棋游戏mod.py 神经网络模型xl.py 训练的代码aigame.py 玩家与对战的五子棋game.py class game:... [阅读全文]

Python内置函数round()的用法和注意事项详解

前言在 python 编程中，round()函数是一个非常实用的内置函数，用于对数字进行四舍五入。无论是在数据处理、财务计算还是科学计算中，round()函数都... [阅读全文]

Python代码实现一个AI多站点搜索神器

在人工智能快速发展的今天，我们经常需要在多个ai平台上尝试同一个提示词。每次手动打开网站、复制粘贴真的很麻烦，对吧？今天，我将分享一个python小工具，帮你一... [阅读全文]


验证码：

验证码：

Python如何实现读取csv文件时忽略文件的编码格式

2025年03月04日 • Python •我要评论

1、背景介绍

2、库的安装

3、核心代码

4、完整代码

相关文章:

发表评论