Tesseract .Net SDK

C# OCR 库

  • #将扫描的 PDF 转换为可搜索的文档
  • #快速而精确的基于神经网络的引擎
  • #正确的低质量扫描
  • #120+ 种语言
  • #.Net 2.0+、.Net 5、标准、核心
下载 Tesseract.Net SDK 使用 NuGet 安装

将扫描的 PDF 转换为可搜索的 PDF

4 行代码,仅此而已

简直是魔法!

多亏了简单的 API,您可以使用几行代码将扫描的 PDF 转换为可搜索的文档。

顺便说一句,不仅仅是PDF。 将 JPEG、多页 TIFF 或 PNG 转换为可搜索的 PDF 到您的应用程序现在只需几分钟,而不是几小时或几天。

有关API的更多信息请联系我们

阅读 120 多种语言的多种图像格式

Tesseract.NET SDK 可以准确识别 120 多种语言的文本,支持多语言文本,并且可以通过训练使用以前未知的语言。 支持的标准包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

正确的低质量扫描

例如,去歪斜输入过滤器会自动旋转图像,因此它是正确的向上和正交的。 如果页面过于倾斜,则 Tesseract 的线分割质量会显着降低,这会严重影响 OCR 的质量。

Patagames OCR SDK 内置的用于增强 OCR 性能的输入过滤器包括:二值化、对比度和对比度标准化、去偏斜、增强分辨率、腐蚀和扩张、膨胀和放气、反转、移除边框、旋转、ToGray 和白色背景。

为您的 .Net 应用程序配备 OCR 功能的最佳方式

虽然 Tesseract 无疑是迄今为止最好的 OCR 库,但 Tesseract.NET SDK 是为您的应用程序配备文本识别功能的最佳方式之一。

Tesseract.Net SDK 结合了易于部署、卓越的识别精度、快速 OCR 和各种输出选项(包括 PDF、HOCR、UNLV 和纯文本),提供灵活简单的 API 以及许多高级和低级文本识别程序。

多亏了简单的 API,您可以用几行代码将给定的图像转换为可搜索的文本。 如果您需要更详细地了解文本的组成部分,Tesseract.NET SDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。

您现在可以试用 Tesseract.NET SDK,体验可用于 .Net 应用程序的最快、最完美的光学识别。

享受支持 OCR 的 .Net 应用程序的强大开发!

Tesseract.Net SDK

下载

NuGet 包也可在 nuget.org 的官方仓库中获得

PM> 安装包Tesseract.Net.SDK

专为以下设计

PATAGAMES © 2022
| 隐私政策 | EULA | 博客
COGITO SOFTWARE CO., LIMITED版权所有