通过C#和IronOcr实现图片文字自动识别(OCR)和提取_Asp.net

前言

嗨，大家好！

你了解图片文字识别技术（ocr）吗？

所谓的图片文字识别，简单地说，就是识别并提取图片中的文字，英文简称为 ocr。

近年来，这项技术得到了广泛应用，成为了提升工作效率的利器，想像一下，你需要将某张图片上的文字录入信息库，看着图片一个字一个字的敲打录入，那有该多辛苦！

如果有一个图片文字识别提取工具，点击一下，就能将图片上的文字直接提取出来，这该有多方便！

今天，我们就来聊聊如何使用 c# 实现 ocr 功能，并分享一个详细的例子。

话不多说，我们直接开始吧！

step by step 详细步骤

1. 创建项目

创建一个 winforms 应用桌面程序项目，命名为 “winformsocrsample”

2. 安装 nuget 包

在项目中添加以下 nuget 包

<packagereference include="ironocr" version="2023.5.35" />
<packagereference include="ironocr.languages.chinese" version="2020.11.2" />

注意：如果不装 ironocr.languages.chinese，识别中文时会变成乱码，所以一定要记得装这个包！

3. 设计窗体

接下来，在主窗体上放置两个文本框和一个按钮。

第一个文本框用于输入图片路径，第二个文本框用于显示识别结果，按钮则用于触发 ocr 操作。

如下图：

4. 编写文字自动识别代码

双击窗体上按钮，自动生成按钮单击事件并跳转到代码界面，编写如下代码，留意其中的注释：

using ironocr;
using system;
using system.collections.generic;
using system.componentmodel;
using system.data;
using system.drawing;
using system.linq;
using system.text;
using system.threading.tasks;
using system.windows.forms;

namespace winformsocrsample
{
    public partial class frmimgocr : form
    {
        public frmimgocr()
        {
            initializecomponent();
        }

        private void btnocr_click(object sender, eventargs e)
        {
            // 初始化 ocr 引擎
            var ocr = new irontesseract();

            // 配置不读取二维码
            ocr.configuration.readbarcodes = false;

            // 设置语言为简体中文
            ocr.language = ocrlanguage.chinesesimplifiedbest;

            using (var ocrinput = new ocrinput())
            {
                // 加载图片
                ocrinput.addimage(txtfilepath.text.trim());

                // 提高识别质量的设置（可选）
                ocrinput.deskew();  	// 仅当图片倾斜时使用
                // ocrinput.denoise();  // 仅当图片包含数字噪声时使用

                // 执行 ocr 并获取结果
                var ocrresult = ocr.read(ocrinput);
                txtresult.text = ocrresult.text;  // 显示识别结果
            }
        }
    }
}

5. 运行并测试

准备一个有文字的图片，如下图：

运行程序，输入图片路径，点击 “文字识别” 按钮，很快地就自动识别出图片上的文字，并输出结果，如下图：

总结

搞定！是不是比想象中简单？只需要几行代码，就让 c# 轻松实现图片文字的自动识别，而且，准确率还不错！

事实上，除了图片上文字，pdf 也可以轻松识别，你可以在 ironocr 的官网上解锁更多姿势！

看到这里，你是不是也心动了，赶快也尝试一下吧！

以上就是通过c#和ironocr实现图片文字自动识别(ocr)和提取的详细内容，更多关于c# ironocr图片文字自动识别和提取的资料请关注代码网其它相关文章！

C#实现插入与删除Word文档目录的完整指南

在日常的办公自动化或文档处理场景中，word 文档的目录（table of contents, toc）扮演着至关重要的角色。一个结构清晰、易于导航的目录不仅能... [阅读全文]

使用jasypt对yml文件进行加密解密的实现

在日常开发中，我们一般会把账号密码以及一些用到的各种第三方服务的access_key都放入yml文件中，这时就有必要对yml文件进行加密处理了，jasypt是一... [阅读全文]

使用C#实现DataSet与Excel的互相转换

在日常开发中，dataset是 .net 程序中常用的数据容器，而excel 文件则是数据交换和报表的常见格式。在实际业务中，经常需要将数据库查询结果保存到 e... [阅读全文]

C#判断文件是否存在的常用方法

在 c# 中，有几种常用的方法来检查文件是否存在。以下是各种方法的详细说明和示例：1. 使用file.exists方法（最常用）using system.io;... [阅读全文]

Core i5-14400F和Ryzen 5 7600X谁更值得入手? 七款游戏性能对比测评

现阶段如果要组装性价比游戏主机，处理器有以下几款热门型号可选，分别是：core i5-12400f、core i5-14400f、ryzen 5 7500f、ryzen 5 760…

2025年11月28日 • 编程语言

使用C#在Excel工作表中查找与替换数据的操作指南

在日常业务中，excel 常用于保存产品清单、客户信息、销售记录等结构化数据。当表格数据量较大时，手动查找与替换内容不仅效率低，还容易出错。此时借助c# 程序自... [阅读全文]


验证码：

验证码：

通过C#和IronOcr实现图片文字自动识别(OCR)和提取

2025年11月27日 • Asp.net •我要评论

前言