LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

C# 使用 PaddleOCR 进行图片文字识别

admin
2024年12月29日 19:1 本文热度 276

概述 

PaddleOCR 是由百度飞桨(PaddlePaddle)深度学习平台开发的多语言 OCR 工具库,支持80多种语言的文本识别,并提供数据标注、文本图像矫正、版面区域检测、表格识别等功能。本文将详细介绍如何在 C# 项目中使用 PaddleOCR 进行图片文字识别,并附上示例代码。

环境配置 

1. 准备开发环境

  • 操作系统:Windows 或 Linux(如 Ubuntu、CentOS)
  • 开发工具:Visual Studio 2022 或 Rider
  • 框架版本:.NET 6 或更高版本

2. 安装 PaddleOCRSharp

在你的项目中,使用以下命令安装 PaddleOCRSharp NuGet 包:

dotnet add package PaddleOCRSharp

或者通过 Visual Studio 的 NuGet 管理器搜索 PaddleOCRSharp 并安装。

3. 下载模型文件

PaddleOCR 需要预训练模型文件来完成 OCR 任务。可以通过以下步骤获取:

  1. 访问 PaddleOCR 的官方 GitHub 仓库:PaddleOCR GitHub
  2. 下载适合自己需求的模型文件(如 ch_PP-OCRv3 用于中文简体 OCR)。
  3. 将模型文件存放到项目目录中,例如 models/ocr_det_infer 和 models/ocr_rec_infer

代码实现 

1. 创建 OCR 实例

PaddleOCRSharp 的核心类是 PaddleOCREngine,它需要模型路径和运行配置。

using PaddleOCRSharp;

public class OCRDemo
{
    private PaddleOCREngine _ocrEngine;

    public OCRDemo()
    {
        // 设置模型路径
        string detModelPath = @"models/ocr_det_infer";
        string recModelPath = @"models/ocr_rec_infer";
        string keysPath = @"models/ppocr_keys.txt";
        // 初始化 OCR 引擎
        _ocrEngine = new PaddleOCREngine(
            detModelPath: detModelPath,
            recModelPath: recModelPath,
            keysPath: keysPath,
            useGpu: false // 是否使用 GPU
        );
    }
}

2. 进行 OCR 识别

PaddleOCREngine 提供了 DetectAndRecognize 方法,可以对图像文件中的文本进行检测和识别。

using System;
using System.Drawing;

public class OCRDemo
{
    private PaddleOCREngine _ocrEngine;

    public OCRDemo()
    {
        string detModelPath = @"models/ocr_det_infer";
        string recModelPath = @"models/ocr_rec_infer";
        string keysPath = @"models/ppocr_keys.txt";
        _ocrEngine = new PaddleOCREngine(detModelPath, recModelPath, keysPath, useGpu: false);
    }

    public void RecognizeText(string imagePath)
    {
        using (Bitmap bitmap = new Bitmap(imagePath))
        {
            // 调用 OCR 引擎进行识别
            var results = _ocrEngine.DetectAndRecognize(bitmap);
            // 输出识别结果
            foreach (var result in results)
            {
                Console.WriteLine($"Text: {result.Text}, Confidence: {result.Score}");
            }
        }
    }
}

3. 主程序调用

创建一个简单的控制台应用程序调用以上代码:

class Program
{
    static void Main(string[] args)
    {
        var ocrDemo = new OCRDemo();
        Console.WriteLine("请输入待识别图像的路径:");
        string imagePath = Console.ReadLine();
        ocrDemo.RecognizeText(imagePath);
    }
}

结论 

通过上述步骤,我们可以在 C# 项目中轻松集成 PaddleOCR,实现对图片中文字的识别。PaddleOCRSharp 提供了一种简便的方法来利用 PaddlePaddle 的强大功能,使得开发者能够快速地在 C# 环境中应用深度学习进行文字识别。


阅读原文:原文链接


该文章在 2024/12/30 14:34:10 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2025 ClickSun All Rights Reserved