python使用tesseract实现字符识别功能_Python

介绍

tesseract 是一个开源的光学字符识别（ocr）引擎，它能够识别多种语言的文本，可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式。

1. 安装tesseract

首先到下列地址处，下载tesseract安装程序，并安装。

tesseract下载地址(第三方非官网)

https://digi.bib.uni-mannheim.de/tesseract/

安装完成后，进入安装目录找到tesseract.exe，并且拷贝路径，然后到编译器编写python代码。

2. 编写python代码

import cv2
import pytesseract

# 指定 tesseract-ocr 可执行文件的路径
pytesseract.pytesseract.tesseract_cmd = "d:\\computer_vision_lib\\tesseract-ocr5.3\\tesseract.exe"

# 选择一张要识别的字符图片
img = cv2.imread("test.png")
img = cv2.cvtcolor(img, cv2.color_bgr2rgb)

# 使用 tesseract-ocr 进行文字识别，并返回识别到的字符
print(pytesseract.image_to_string(img))
print('--'*10)

# 获取每个字符的边界框的坐标
print(pytesseract.image_to_boxes(img))

himg, wimg, _ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
    b = b.split(' ')
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x, himg - y), (w, himg - h), (0, 0, 255), 3)
    cv2.puttext(img, b[0], (x, himg - y + 25), cv2.font_hershey_complex, 1, (50, 50, 255), 2)

cv2.imshow("image", img)
cv2.waitkey(0)

执行截图如下：

到此这篇关于python使用tesseract实现字符识别功能的文章就介绍到这了,更多相关python tesseract字符识别内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

python如何实现lazy segment tree惰性段树算法

lazy segment tree惰性段树算法介绍lazy segment tree（惰性段树）算法是一种高效的数据结构，用于处理区间查询和区间更新操作。它通过... [阅读全文]

Python脚本检测笑脸漏洞的问题复现

python脚本检测笑脸漏洞一、漏洞介绍 vsftpd2.3.4中在6200端口存在一个shell,使得任何人都可以进行连接，并且vsftpd v2.3.4 服务，是以 root…

2024年10月23日 • 前端脚本

Python连接和操作PostgreSQL数据库的流程步骤

引言在当今信息化的时代，数据库已成为存储和管理数据的关键技术。postgresql 是一种开源的对象关系型数据库管理系统（ordbms），以其强大的功能和稳定性... [阅读全文]

基于Python实现植物大战僵尸游戏的示例代码

引言植物大战僵尸是一款经典的塔防类游戏，玩家通过种植各种植物来抵御僵尸的攻击。这款游戏由popcap games开发，自发布以来便受到了全球玩家的喜爱。本文将详... [阅读全文]

python实现读取学术论文PDF文件内容

1、pypdf2pypdf2 是一个常用的库，可以用来读取、合并、分割和修改pdf文件。读取pdf内容：import pypdf2# 打开pdf文件with open('ellk-…

2024年10月23日 • 前端脚本

Python Playwright进行常见的页面交互操作

在使用 playwright 进行 web 自动化时，页面交互是核心操作之一。无论是访问页面、等待元素加载、截图，还是自动填写表单，playwright 提供了... [阅读全文]


验证码：

验证码：

python使用tesseract实现字符识别功能

2024年10月24日 • Python •我要评论

介绍

1. 安装tesseract

2. 编写python代码

相关文章:

Python脚本检测笑脸漏洞的问题复现

python实现读取学术论文PDF文件内容

发表评论