Python进行图片信息提取并重命名_Python

一、问题

有人在微信群问如何快速把一些图片中的第一行或第二行的文字提取出来，并将其重命名。人工操作费时费力，如果用python就可以实现批量操作，而不必一张一张识别、校对再重命名了。

二、主要思路

tesseract-ocr是一款优秀的开源ocr软件，目前由google维护改进，已发展到5.0版本，从4.0版本起增加了基于lstm神经网络的识别引擎。

本项目的主要思路是用tesseract-ocr工具来识别图片，虽然这个工具的识别率并不高，但是免费可以使用，亲测效果不错。然后，提取图片中的第一行和第二行的内容为字符串，并将其中不能用于文件名的符号清除掉，再采用os.rename()来重命名。

1. 安装相应的包

要想识别图片，就要安装了 pytesseract 库和pil库

pip install pytesseract,pil

2. 下载tessaract-ocr工具

如果光安装pytesseract库，不安装这个软件也不行，大家可以去下面的地址下载。

https://github.com/ub-mannheim/tesseract/wikigithub.com/ub-mannheim/tesseract/wiki

下载和你系统警醒的软件

3. 安装tesseract

下载到本地后，大约有49m，然后进行安装，注意下载过程中要识别不同的语言，就要勾选相应的语种，如我要识别的是中文，语言那里勾选的是chinese-simplified。

安装tesseract

4. 配置环境

安装完之后，我们还需要找到安装目录下这个tesseract.exe的路径，把它的路径放到python里。

pytesseract.pytesseract.tesseract_cmd = r'd:\program files\tesseract-ocr\tesseract.exe'

5. 编写代码

万事俱备，就可以编写代码。编写时，需要用到文件管理模块os，正则表达式模块re，图像编辑模块pil等。

import os
import re
from pil import image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'd:\program files\tesseract-ocr\tesseract.exe'
 
def sanitize_filename(name):
    """去除文件名中不允许的字符"""
    return re.sub(r'[<>:"/\\|?*]', '', name)
 
def rename_images_with_first_line_text(folder_path):
    # 获取文件夹中所有的jpg图片
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(".jpg"):
            image_path = os.path.join(folder_path, filename)
            try:
                # 打开图片并使用 pytesseract 识别第一行文字
                image = image.open(image_path)
                text = pytesseract.image_to_string(image, lang="chi_sim")  # 识别简体中文
                first_line = "".join(text.splitlines()[0:2]).strip()  # 仅取第一行和第二行文字并去除空格
 
                if first_line:
                    # 将文件名设为识别到的第一行文字
                    new_filename = f"{sanitize_filename(first_line)}.jpg"
                    new_path = os.path.join(folder_path, new_filename)
                    os.rename(image_path, new_path)
                    print(f"文件已重命名为: {new_filename}")
                else:
                    print(f"未检测到文字，跳过文件: {filename}")
 
            except exception as e:
                print(f"处理文件 {filename} 时出错: {e}")
 
# 使用文件夹路径调用函数
folder_path = "."  # 替换为存放jpg图片的文件夹路径
rename_images_with_first_line_text(folder_path)

三、学后总结

1. 采用tesseract来进行图片识别效率还挺高，一秒基本上一张，就是准备率还需要进一步提升。据说还可以进行模型训练，进一步提高其准确率。

2. 后期可以采用百度等大厂的图片识别api进行语片识别，进一步提高准确率。

3. 采用指定模块进行图片识别提供了一个不错的思路，毕竟现在api的调用费也十分高昂。

到此这篇关于python进行图片信息提取并重命名的文章就介绍到这了,更多相关python提取图片信息内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Pytorch中的masked_fill基本知识操作

1. 基本知识基本的原理知识如下：输入张量和掩码：masked_fill 接受两个主要参数：一个输入张量和一个布尔掩码掩码的形状必须与输入张量相同，true 表... [阅读全文]

Python异步编程入门之实现文件批处理的并发处理方式

引言在现代软件开发中，处理大量文件或数据时，提高处理效率和并发性是非常重要的。python 的 asyncio 库提供了一种强大的方式来实现异步编程，从而提高程... [阅读全文]

深入理解 Python 中的 pip 虚拟环境(最佳实践)

引言在现代软件开发中，依赖管理和环境隔离是确保项目稳定性和可维护性的关键，尤其是在使用 python 进行开发时，开发者常常面临多个项目之间依赖冲突的问题。为了... [阅读全文]

基于python实现一个简单的浏览器引擎

1. 浏览器引擎工作原理浏览器引擎是用来处理、渲染和显示网页内容的核心组件。其主要任务是将用户输入的url所代表的网页资源加载并呈现出来，通常包括html、cs... [阅读全文]

Python中格式化字符串的方法总结

字符串格式化字符串格式化是一项常见且重要的操作，用于动态生成包含变量内容的字符串。关于字符串的格式化，在python的历史上，曾经存在多种格式化字符串的方式，因... [阅读全文]

Python使用进程池并发执行SQL语句的操作代码

这段代码使用了 python 的multiprocessing模块来实现真正的并行处理，绕过 python 的全局解释器锁（gil）限制，从而在多核 cpu 上... [阅读全文]


验证码：

验证码：

Python进行图片信息提取并重命名

2024年10月30日 • Python •我要评论