Enum TextExtractorOptions.TextFormattingMode

TextExtractorOptions.TextFormattingMode 枚举

定义在将 PDF 文档转换为文本时可以使用的不同模式。请参见 TextExtractorOptions 类。

public enum TextFormattingMode

名称描述
Pure0表示 PDF 文本内容,具有一些格式化例程。这包括考虑相对位置并添加额外空格以将文本对齐到页面宽度。
Raw1表示 PDF 内容原样,即不进行格式化。
Plain2表示 PDF 文本内容,考虑文本片段的相对位置,但不添加额外空格。

另请参见