当前位置: 代码网 > it编程>前端脚本>Python > Python解析压缩包内部文件的后缀名并分类存放

Python解析压缩包内部文件的后缀名并分类存放

2024年12月25日 Python 我要评论
1、背景我们有很多压缩包文件,假设压缩包的种类只有【.7z】,【.rar】,【.zip】,压缩包里面有一个文件,文件可以是不同的格式(后缀),我们希望通过压缩包内的文件后缀,自动创建文件夹,让后将压缩

1、背景

我们有很多压缩包文件,假设压缩包的种类只有【.7z】,【.rar】,【.zip】,压缩包里面有一个文件,文件可以是不同的格式(后缀),我们希望通过压缩包内的文件后缀,自动创建文件夹,让后将压缩包进行批量移动

如下图:每一个压缩包内都有一个文件(不同类型\也可以相同类型)

预期结果,如下图

2、库的安装

用途安装
py7zr压缩包.7z操作pip install py7zr -i https://pypi.tuna.tsinghua.edu.cn/simple/
rarfile压缩包.rar操作pip install rarfile -i https://pypi.tuna.tsinghua.edu.cn/simple/
zipfile压缩包.rar操作内置库无需安装
os获取绝对路径内置库无需安装

3、核心代码

if zipfile.is_zipfile(archive_path):
    with zipfile.zipfile(archive_path, 'r') as zip_ref:
        for file_info in zip_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])  # 去掉点号

elif rarfile.is_rarfile(archive_path):
    with rarfile.rarfile(archive_path) as rar_ref:
        for file_info in rar_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

elif py7zr.is_7zfile(archive_path):
    with py7zr.sevenzipfile(archive_path, mode='r') as z7_ref:
        for filename in z7_ref.getnames():
            ext = os.path.splitext(filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

4、完整代码

# -*- coding: utf-8 -*-
'''
@project :测试 
@file    :main.py
@ide     :pycharm 
@author  :一晌小贪欢(278865463@qq.com)
@date    :2024/12/23 15:32 
'''


import os
import zipfile
import py7zr
import rarfile
import shutil

# 设置源文件夹和目标文件夹
source_folder = '压缩包数据源'
target_folder = '分类文件夹'

# 检查目标文件夹是否存在,不存在则创建
if not os.path.exists(target_folder):
    os.makedirs(target_folder)


def create_folder(folder_name):
    folder_path = os.path.join(target_folder, folder_name)
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    return folder_path


def get_archive_extensions(archive_path):
    extensions = set()

    try:
        if zipfile.is_zipfile(archive_path):
            with zipfile.zipfile(archive_path, 'r') as zip_ref:
                for file_info in zip_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])  # 去掉点号

        elif rarfile.is_rarfile(archive_path):
            with rarfile.rarfile(archive_path) as rar_ref:
                for file_info in rar_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])

        elif py7zr.is_7zfile(archive_path):
            with py7zr.sevenzipfile(archive_path, mode='r') as z7_ref:
                for filename in z7_ref.getnames():
                    ext = os.path.splitext(filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])
    except exception as e:
        print(f"读取文件 {archive_path} 时出错: {str(e)}")
        return set()

    return extensions


# 主程序
for filename in os.listdir(source_folder):
    file_path = os.path.join(source_folder, filename)

    if os.path.isfile(file_path):
        # 获取压缩包内所有文件的扩展名
        extensions = get_archive_extensions(file_path)

        if extensions:
            # 如果只有一种文件类型,移动到对应文件夹
            if len(extensions) == 1:
                ext = extensions.pop()
                dest_folder = create_folder(ext)
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移动 {filename} 到 {ext} 文件夹")
            else:
                # 如果有多种文件类型,移动到 mixed 文件夹
                dest_folder = create_folder('mixed')
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移动 {filename} 到 mixed 文件夹 (包含文件类型: {', '.join(extensions)})")
        else:
            print(f"跳过文件: {filename} (无法读取或没有有效文件)")

到此这篇关于python解析压缩包内部文件的后缀名并分类存放的文章就介绍到这了,更多相关python解析文件后缀名内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com