当前位置: 代码网 > it编程>编程语言>Asp.net > 通过C#和IronOcr实现图片文字自动识别(OCR)和提取

通过C#和IronOcr实现图片文字自动识别(OCR)和提取

2025年11月27日 Asp.net 我要评论
前言嗨,大家好!你了解图片文字识别技术(ocr)吗?所谓的图片文字识别,简单地说,就是识别并提取图片中的文字,英文简称为 ocr。近年来,这项技术得到了广泛应用,成为了提升工作效率的利器,想像一下,你

前言

嗨,大家好!

你了解图片文字识别技术(ocr)吗?

所谓的图片文字识别,简单地说,就是识别并提取图片中的文字,英文简称为 ocr。

近年来,这项技术得到了广泛应用,成为了提升工作效率的利器,想像一下,你需要将某张图片上的文字录入信息库,看着图片一个字一个字的敲打录入,那有该多辛苦!

如果有一个图片文字识别提取工具,点击一下,就能将图片上的文字直接提取出来,这该有多方便!

今天,我们就来聊聊如何使用 c# 实现 ocr 功能,并分享一个详细的例子。

话不多说,我们直接开始吧!

step by step 详细步骤

1. 创建项目

创建一个 winforms 应用桌面程序项目,命名为 “winformsocrsample”

2. 安装 nuget 包

在项目中添加以下 nuget 包

<packagereference include="ironocr" version="2023.5.35" />
<packagereference include="ironocr.languages.chinese" version="2020.11.2" />

注意:如果不装 ironocr.languages.chinese,识别中文时会变成乱码,所以一定要记得装这个包!

3. 设计窗体

接下来,在主窗体上放置两个文本框和一个按钮。

第一个文本框用于输入图片路径,第二个文本框用于显示识别结果,按钮则用于触发 ocr 操作。

如下图:

4. 编写文字自动识别代码

双击窗体上按钮,自动生成按钮单击事件并跳转到代码界面,编写如下代码,留意其中的注释

using ironocr;
using system;
using system.collections.generic;
using system.componentmodel;
using system.data;
using system.drawing;
using system.linq;
using system.text;
using system.threading.tasks;
using system.windows.forms;

namespace winformsocrsample
{
    public partial class frmimgocr : form
    {
        public frmimgocr()
        {
            initializecomponent();
        }

        private void btnocr_click(object sender, eventargs e)
        {
            // 初始化 ocr 引擎
            var ocr = new irontesseract();

            // 配置不读取二维码
            ocr.configuration.readbarcodes = false;

            // 设置语言为简体中文
            ocr.language = ocrlanguage.chinesesimplifiedbest;

            using (var ocrinput = new ocrinput())
            {
                // 加载图片
                ocrinput.addimage(txtfilepath.text.trim());

                // 提高识别质量的设置(可选)
                ocrinput.deskew();  	// 仅当图片倾斜时使用
                // ocrinput.denoise();  // 仅当图片包含数字噪声时使用

                // 执行 ocr 并获取结果
                var ocrresult = ocr.read(ocrinput);
                txtresult.text = ocrresult.text;  // 显示识别结果
            }
        }
    }
}

5. 运行并测试

准备一个有文字的图片,如下图:

运行程序,输入图片路径,点击 “文字识别” 按钮,很快地就自动识别出图片上的文字,并输出结果,如下图:

总结

搞定!是不是比想象中简单?只需要几行代码,就让 c# 轻松实现图片文字的自动识别,而且,准确率还不错!

事实上,除了图片上文字,pdf 也可以轻松识别,你可以在 ironocr 的官网上解锁更多姿势!

看到这里,你是不是也心动了,赶快也尝试一下吧!

以上就是通过c#和ironocr实现图片文字自动识别(ocr)和提取的详细内容,更多关于c# ironocr图片文字自动识别和提取的资料请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com