AsposeOcr

AsposeOcr class

Aspose OCR 库的主要 API

public class AsposeOcr : IDisposable

构造函数

名称	描述
AsposeOcr()	初始化一个新的 `AsposeOcr` 类实例。空构造函数。

方法

名称	描述
CalculateSkew(OcrInput)	计算图像的倾斜角度。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、归档。
CompareImageTexts(string, string, RecognitionSettings, bool)	检查两幅图像是否包含相同的文本。
CorrectSpelling(string, SpellCheckLanguage, string)	纠正文本（替换拼写错误的单词）。
DetectDefects(OcrInput, DefectType)	自动查找图像中可能显著影响 OCR 准确性的有问题区域。支持以文件、流或像素数组形式提供的 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像。支持批量识别。
DetectDocumentLayout(OcrInput)	分析图像并识别其中不同类型的内容区域。支持来自文件、流和像素数组的 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像。可批量处理文件夹和压缩包。
DetectLanguages(OcrInput)	分析图像上的文本以确定其所使用的语言。这使得能够选择最合适的识别语言，并有助于后续的文本处理任务，如拼写检查或翻译。
DetectRectangles(OcrInput)	检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
DetectRectangles(OcrInput, AreasType, bool)	检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
Dispose()	清除识别资源。
ImageHasText(string, Regex, RecognitionSettings, bool)	检查图像文本是否匹配提供的正则表达式。
ImageHasText(string, string, RecognitionSettings, bool, bool)	检查图像是否包含提供的文本片段。
ImageTextDiff(string, string, RecognitionSettings, bool, bool)	比较两幅图像上的文本，并返回表示相似度的数值（0 到 1）。
Recognize(OcrInput)	识别图像/文档上的文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、数组、压缩包。
Recognize(OcrInput, AsposeOcrPresets)	使用预定义的预设配置识别给定 OCR 输入中的文本。
Recognize(OcrInput, RecognitionSettings)	识别图像/文档上的文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、数组、压缩包。
Recognize(OcrInput, RecognitionSettings, CancellationToken)	识别图像/文档上的文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、数组、压缩包。
RecognizeCarPlate(OcrInput)	识别车牌上的文本。
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)	识别车牌上的文本。
RecognizeCharacters(OcrInput)	检测图像上的符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
RecognizeCharacters(OcrInput, DetectAreasMode, Language)	检测图像上的符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
RecognizeFast(OcrInput)	识别图像/文档上的文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、数组、压缩包。
RecognizeFormula(OcrInput, bool)	识别提供的输入图像中的数学公式。
RecognizeFormulaAI(OcrInput)	使用 AI 识别提供的输入图像中的数学公式。
RecognizeHandwrittenText(OcrInput)	识别图像上的手写文本。
RecognizeIDCard(OcrInput)	识别身份证上的文本。
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)	识别身份证上的文本。
RecognizeInvoice(OcrInput)	识别发票上的文本。
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)	识别发票上的文本。
RecognizeLines(OcrInput)	识别包含单行文本的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
RecognizeLines(OcrInput, RecognitionSettings)	识别包含单行文本的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、数组、压缩包。
RecognizePassport(OcrInput)	识别护照上的文本。
RecognizePassport(OcrInput, PassportRecognitionSettings)	识别护照上的文本。
RecognizeReceipt(OcrInput)	识别收据上的文本。
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)	识别收据上的文本。
RecognizeTables(OcrInput, Language)	检测表格和结构，识别文本单元格。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、数组、压缩包。
static SaveMultipageDocument(MemoryStream, SaveFormat, List<RecognitionResult>, string, PdfOptimizationMode)	允许从 RecognitionResult 对象列表中获取多页文档
static SaveMultipageDocument(string, SaveFormat, List<RecognitionResult>, string, PdfOptimizationMode)	允许从 RecognitionResult 对象列表中获取多页文档
static SaveMultipageDocument(MemoryStream, SaveFormat, List<RecognitionResult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)	允许从 RecognitionResult 对象列表中获取多页文档
static SaveMultipageDocument(string, SaveFormat, List<RecognitionResult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)	允许从 RecognitionResult 对象列表中获取多页文档

字段

名称	描述
static DebugMode	启用调试模式。启用后，系统会保存中间图像处理结果，例如预处理图像和绘制了文本行矩形的图像。
static DebugModeSaveDirectory	调试结果将保存的目录。如果未设置，默认使用当前工作目录。

事件

名称	描述
event OcrProgress	用于跟踪多页图像识别进度的事件。

另请参见

namespace Aspose.OCR
assembly Aspose.OCR

OcrRecognizeEventHandler Metered