Tesseract .Net SDK

C# OCR 库

下载 Tesseract.Net SDK 使用 NuGet 安装

将扫描的 PDF 转换为可搜索的 PDF

4 行代码，仅此而已

简直是魔法！

多亏了简单的 API，您可以使用几行代码将扫描的 PDF 转换为可搜索的文档。

顺便说一句，不仅仅是PDF。将 JPEG、多页 TIFF 或 PNG 转换为可搜索的 PDF 到您的应用程序现在只需几分钟，而不是几小时或几天。

有关API的更多信息请联系我们

Tesseract.NET SDK 可以准确识别 120 多种语言的文本，支持多语言文本，并且可以通过训练使用以前未知的语言。支持的标准包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

例如，去歪斜输入过滤器会自动旋转图像，因此它是正确的向上和正交的。如果页面过于倾斜，则 Tesseract 的线分割质量会显着降低，这会严重影响 OCR 的质量。

Patagames OCR SDK 内置的用于增强 OCR 性能的输入过滤器包括：二值化、对比度和对比度标准化、去偏斜、增强分辨率、腐蚀和扩张、膨胀和放气、反转、移除边框、旋转、ToGray 和白色背景。

虽然 Tesseract 无疑是迄今为止最好的 OCR 库，但 Tesseract.NET SDK 是为您的应用程序配备文本识别功能的最佳方式之一。

Tesseract.Net SDK 结合了易于部署、卓越的识别精度、快速 OCR 和各种输出选项（包括 PDF、HOCR、UNLV 和纯文本），提供灵活简单的 API 以及许多高级和低级文本识别程序。

多亏了简单的 API，您可以用几行代码将给定的图像转换为可搜索的文本。如果您需要更详细地了解文本的组成部分，Tesseract.NET SDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。

您现在可以试用 Tesseract.NET SDK，体验可用于 .Net 应用程序的最快、最完美的光学识别。

享受支持 OCR 的 .Net 应用程序的强大开发！

下载

NuGet 包也可在 nuget.org 的官方仓库中获得

PM> 安装包Tesseract.Net.SDK

| 隐私政策 | EULA | 博客