DocumentRecognitionSettings

DocumentRecognitionSettings class

PDF 识别的设置。包含可自定义识别过程的元素。

public class DocumentRecognitionSettings : BaseRecognitionSettings

构造函数

名称描述
DocumentRecognitionSettings(int, int)使用简短属性集初始化 DocumentRecognitionSettings 类的新实例。
DocumentRecognitionSettings(int, int, Language, bool, bool, int)使用完整属性集初始化 DocumentRecognitionSettings 类的新实例。

属性

名称描述
AllowedCharacters { get; set; }允许字符集。确定识别结果允许的字符类型。
AutoContrast { get; set; }允许在识别前对图像使用额外的对比度校正算法。
AutoDenoising { get; set; }启用额外的神经网络以提升图像——降低噪声。适用于带有扫描伪影、失真、斑点、耀光、渐变或异物的图像。
AutoSkew { set; }获取或设置一个标志,指示是否应启用自动图像倾斜校正。默认启用(true)。
DetectAreasMode { get; set; }允许为文档类型区域选择最佳模式:文档、照片、纯文本、列、图像。
IgnoredCharacters { get; set; }设置识别符号的黑名单。
Language { set; }获取或设置用于 OCR 的语言。确定识别期间使用的字母表。默认情况下为多语言。
LinesFiltration { get; set; }允许识别表格中的文本(被线条包围的区域)。
PagesNumber { get; set; }设置多页 PDF 文件的识别页数。
PreprocessingFilters { get; set; }允许通过调整预处理方法来准备图像进行 OCR。
SkewAngle { set; }获取或设置图像旋转的角度(度)。设置此值将禁用 AutoSkew 属性,从而不进行自动倾斜校正。默认值为零。
StartPage { get; set; }设置要识别的起始页。
ThreadsCount { set; }获取或设置用于处理的线程数。默认情况下,0 表示图像将使用等于处理器数量的线程数进行处理。ThreadsCount = 1 表示图像将在主线程中处理。
ThresholdValue { set; }获取或设置图像二值化的自定义阈值。范围为 1 到 255。
UpscaleSmallFont { get; set; }允许使用专用于小字体识别的额外算法。适用于字符尺寸较小的图像。

另请参见