DocumentRecognitionSettings

DocumentRecognitionSettings class

PDF 识别的设置。包含可自定义识别过程的元素。

public class DocumentRecognitionSettings : BaseRecognitionSettings

构造函数

名称	描述
DocumentRecognitionSettings(int, int)	使用简短属性集初始化 `DocumentRecognitionSettings` 类的新实例。
DocumentRecognitionSettings(int, int, Language, bool, bool, int)	使用完整属性集初始化 `DocumentRecognitionSettings` 类的新实例。

属性

名称	描述
AllowedCharacters { get; set; }	允许字符集。确定识别结果允许的字符类型。
AutoContrast { get; set; }	允许在识别前对图像使用额外的对比度校正算法。
AutoDenoising { get; set; }	启用额外的神经网络以提升图像——降低噪声。适用于带有扫描伪影、失真、斑点、耀光、渐变或异物的图像。
AutoSkew { set; }	获取或设置一个标志，指示是否应启用自动图像倾斜校正。默认启用（true）。
DetectAreasMode { get; set; }	允许为文档类型区域选择最佳模式：文档、照片、纯文本、列、图像。
IgnoredCharacters { get; set; }	设置识别符号的黑名单。
Language { set; }	获取或设置用于 OCR 的语言。确定识别期间使用的字母表。默认情况下为多语言。
LinesFiltration { get; set; }	允许识别表格中的文本（被线条包围的区域）。
PagesNumber { get; set; }	设置多页 PDF 文件的识别页数。
PreprocessingFilters { get; set; }	允许通过调整预处理方法来准备图像进行 OCR。
SkewAngle { set; }	获取或设置图像旋转的角度（度）。设置此值将禁用 `AutoSkew` 属性，从而不进行自动倾斜校正。默认值为零。
StartPage { get; set; }	设置要识别的起始页。
ThreadsCount { set; }	获取或设置用于处理的线程数。默认情况下，0 表示图像将使用等于处理器数量的线程数进行处理。ThreadsCount = 1 表示图像将在主线程中处理。
ThresholdValue { set; }	获取或设置图像二值化的自定义阈值。范围为 1 到 255。
UpscaleSmallFont { get; set; }	允许使用专用于小字体识别的额外算法。适用于字符尺寸较小的图像。

另请参见

PixelType SaveFormat