AsposeOCR

Inheritance: java.lang.Object

All Implemented Interfaces: java.lang.AutoCloseable

public class AsposeOCR implements AutoCloseable

用于从图像中识别文本的主类。

构造函数

构造函数描述
AsposeOCR()公共构造函数。

字段

字段描述
DebugMode启用调试模式。
DebugModeSaveDirectory保存调试结果的目录。

方法

方法描述
CalculateSkew(OcrInput input)计算图像的倾斜角度。
CompareImageTexts(String fullPath1, String fullPath2)检查两个图像是否包含相同的文本。
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)检查两个图像是否包含相同的文本。
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)检查两个图像是否包含相同的文本。
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)纠正文本(替换拼写错误的单词)。
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)纠正文本(替换拼写错误的单词)。
DetectDefects(OcrInput input, DefectType defectType)自动查找图像中可能显著影响 OCR 准确性的有问题区域。
DetectDocumentLayout(OcrInput input)分析图像并识别其中不同类型的内容区域。
DetectLanguages(OcrInput input)分析图像上的文本以确定其所使用的语言。
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)检测图像上的文本区域。
DetectTables(OcrInput images)检测图像上的表格区域。
ImageHasText(String fullPath, String text)检查图像是否包含提供的文本片段(不区分大小写搜索)。
ImageHasText(String fullPath, String text, RecognitionSettings settings)检查图像是否包含提供的文本片段(不区分大小写搜索)。
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)检查图像是否包含提供的文本片段。
ImageHasText(String fullPath, Pattern regex)检查图像文本是否匹配提供的正则表达式。
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)检查图像文本是否匹配提供的正则表达式。
ImageTextDiff(String fullPath1, String fullPath2)比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。
Recognize(OcrInput input)识别图像,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。
Recognize(OcrInput input, RecognitionSettings settings)识别图像,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)识别车牌,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。
RecognizeCharacters(OcrInput input)检测图像上的符号。
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)检测图像上的符号。
RecognizeFast(OcrInput input)识别高质量图像上的文本。
RecognizeFormula(OcrInput input, boolean detectAreas)识别提供的输入图像中的数学公式。
RecognizeHandwrittenText(OcrInput input)识别图像上的手写文本。
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)识别身份证,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)识别发票,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)识别护照并支持指定。
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)识别收据并支持指定,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。
RecognizeTables(OcrInput input, Language language)检测表格和结构,识别文本单元格。
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)允许从 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)允许从 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)允许从 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)允许从 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)允许从带有拼写检查校正的 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)允许从 RecognitionResult 对象列表获取多页文档。
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)允许从 RecognitionResult 对象列表获取多页文档。
close()

AsposeOCR()

public AsposeOCR()

公共构造函数。

DebugMode

public static boolean DebugMode

启用调试模式。启用后,系统会保存中间图像处理结果,例如预处理图像和带有绘制文本行矩形的图像。

DebugModeSaveDirectory

public static String DebugModeSaveDirectory

调试结果保存的目录。如果未设置,默认使用当前工作目录。

CalculateSkew(OcrInput input)

public ArrayList<SkewOutput> CalculateSkew(OcrInput input)

计算图像的倾斜角度。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - 以度为单位的倾斜角度 ArrayList SkewOutput

CompareImageTexts(String fullPath1, String fullPath2)

public boolean CompareImageTexts(String fullPath1, String fullPath2)

检查两个图像是否包含相同的文本。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。

Returns: boolean - 如果图像具有相同的文本(相似度 90%),则为 True。

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

检查两个图像是否包含相同的文本。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。
settingsRecognitionSettings识别设置。

Returns: boolean - 如果图像具有相同的文本(相似度 90%),则为 True。

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

检查两个图像是否包含相同的文本。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。
settingsRecognitionSettings识别设置。
ignoreCasebooleanTrue - 表示不区分大小写的搜索。

Returns: boolean - 如果图像具有相同的文本(相似度 90%),则为 True。

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

纠正文本(替换拼写错误的单词)。

Parameters:

参数类型描述
textjava.lang.String用于校正的文本。
languageSpellCheckLanguage要使用的字典 SpellCheckLanguage

Returns: java.lang.String - 已替换单词的文本。

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

纠正文本(替换拼写错误的单词)。

Parameters:

参数类型描述
textjava.lang.String用于校正的文本。
languageSpellCheckLanguage要使用的字典 SpellCheckLanguage
dictionaryPathjava.lang.String用户字典(频率字典)的完整路径。字典文件格式:UTF-8 编码的纯文本文件。单词和词频用逗号分隔,单词位于第一列,词频位于第二列。每个单词‑词频对占一行。行的定义是以换行符("\n")、回车符("\r")或回车紧跟换行符("\r\n")结束的字符序列。所有单词均应为小写。

Returns: java.lang.String - 已替换单词的文本。

DetectDefects(OcrInput input, DefectType defectType)

public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)

自动查找图像中可能显著影响 OCR 准确性的有问题区域。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput
defectTypeDefectType要识别的缺陷类型 DefectType

Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - 包含已检测文本区域或行的 DefectOutput 列表。

DetectDocumentLayout(OcrInput input)

public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)

分析图像并识别其中不同类型的内容区域。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - 检测到的内容区域。包含 LayoutOutput 的列表。

DetectLanguages(OcrInput input)

public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)

分析图像上的文本以确定其所使用的语言。这使得能够选择最合适的识别语言,并有助于后续的文本处理任务,如拼写检查或翻译。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - 返回按可能性排序的最可能语言列表。包含 LanguageDetectionOutput 的列表。

DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

检测图像上的文本区域。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput
areasTypeAreasType确定返回哪些矩形——行或段落。
isDetectAreasboolean启用自动文本区域检测。

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - 包含已检测文本区域或行的 RectangleOutput 列表。

DetectTables(OcrInput images)

public ArrayList<RectangleOutput> DetectTables(OcrInput images)

检测图像上的表格区域。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
imagesOcrInput包含源的容器。OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - 包含已检测表格区域的 RectangleOutput 列表。

ImageHasText(String fullPath, String text)

public boolean ImageHasText(String fullPath, String text)

检查图像是否包含提供的文本片段(不区分大小写搜索)。

Parameters:

参数类型描述
fullPathjava.lang.String图像的路径。
textjava.lang.String用于在图像上搜索的文本片段。

Returns: boolean - 如果图像包含文本片段则为 True;否则为 False——图像不包含文本片段。

ImageHasText(String fullPath, String text, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)

检查图像是否包含提供的文本片段(不区分大小写搜索)。

Parameters:

参数类型描述
fullPathjava.lang.String图像的路径。
textjava.lang.String用于在图像上搜索的文本片段。
settingsRecognitionSettings识别设置。

Returns: boolean - 如果图像包含文本片段则为 True;否则为 False——图像不包含文本片段。

ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

检查图像是否包含提供的文本片段。

Parameters:

参数类型描述
fullPathjava.lang.String图像的路径。
textjava.lang.String用于在图像上搜索的文本片段。
settingsRecognitionSettings识别设置。
ignoreCasebooleanTrue - 表示不区分大小写的搜索。

Returns: boolean - 如果图像包含文本片段则为 True;否则为 False——图像不包含文本片段。

ImageHasText(String fullPath, Pattern regex)

public boolean ImageHasText(String fullPath, Pattern regex)

检查图像文本是否匹配提供的正则表达式。

Parameters:

参数类型描述
fullPathjava.lang.String图像的路径。
regexjava.util.regex.Patternjava.util.regex.Pattern 对象,包含提供的模式和选项。

Returns: boolean - 如果图像文本匹配提供的正则表达式则为 True。

ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

检查图像文本是否匹配提供的正则表达式。

Parameters:

参数类型描述
fullPathjava.lang.String图像的路径。
regexjava.util.regex.Patternjava.util.regex.Pattern 对象,包含提供的模式和选项。
settingsRecognitionSettings识别设置。

Returns: boolean - 如果图像文本匹配提供的正则表达式则为 True。

ImageTextDiff(String fullPath1, String fullPath2)

public float ImageTextDiff(String fullPath1, String fullPath2)

比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。

Returns: float - 0 表示文本完全不同;1 表示文本完全相同。

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。
settingsRecognitionSettings识别设置。

Returns: float - 0 表示文本完全不同;1 表示文本完全相同。

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

比较两幅图像上的文本并返回表示相似度的数值(0 到 1)。

Parameters:

参数类型描述
fullPath1java.lang.String第一张图像的路径。
fullPath2java.lang.String第二张图像的路径。
settingsRecognitionSettings识别设置。
ignoreCasebooleanTrue - 表示不区分大小写的搜索。

Returns: float - 0 表示文本完全不同;1 表示文本完全相同。

Recognize(OcrInput input)

public OcrOutput Recognize(OcrInput input)

识别图像,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

Recognize(OcrInput input, RecognitionSettings settings)

public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)

识别图像,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsRecognitionSettingsRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

识别车牌,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsCarPlateRecognitionSettingsCarPlateRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCharacters(OcrInput input)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)

检测图像中的符号。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - 包含每个图像检测到的符号数据的 Character ArrayList。

RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

检测图像中的符号。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInput包含源的容器。OcrInput
detectAreasModeDetectAreasMode确定用于区域检测的神经网络类型。
languageLanguageOCR 使用的语言。

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - 包含检测到的符号数据的 Character ArrayList。

RecognizeFast(OcrInput input)

public ArrayList<String> RecognizeFast(OcrInput input)

识别高质量图像上的文本。不使用自动图像倾斜校正和文本区域检测。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput 实例。

Returns: java.util.ArrayList<java.lang.String> - 包含已识别文本的 ArrayList。

RecognizeFormula(OcrInput input, boolean detectAreas)

public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)

识别提供的输入图像中的数学公式。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
detectAreasboolean如果设置为 true,则在执行识别之前自动检测并分离公式区域。如果设置为 false,则将整幅图像视为公式进行处理。

Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput

RecognizeHandwrittenText(OcrInput input)

public OcrOutput RecognizeHandwrittenText(OcrInput input)

识别图像上的手写文本。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。包含源的容器。

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

识别身份证,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsIDCardRecognitionSettingsIDCardRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

识别发票,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsInvoiceRecognitionSettingsInvoiceRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

识别护照并可进行指定。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsPassportRecognitionSettingsPassportRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

识别收据并支持指定,支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 压缩包、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
settingsReceiptRecognitionSettingsReceiptRecognitionSettings

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeTables(OcrInput input, Language language)

public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)

检测表格及其结构,识别文本单元格。支持 GIF、PNG、JPEG、WBMP、TIFF、JFIF、TIFF、PDF、InputStream、BufferedImage、文件夹、数组、zip 存档、URL、base64。

Parameters:

参数类型描述
inputOcrInputOcrInput。实例。
languageLanguage确定识别过程中使用的字母表。

Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - 包含表格中已识别文本的 OCRTablePage 列表对象。 OCRTablePage

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
saveFormatFormat文档格式(Docx、Txt、Pdf、PdfNoImg、Xlsx、Xml、Json、Rtf)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
saveFormatFormat文档格式(Docx、Txt、Pdf、PdfNoImg、Xlsx、Xml、Json、Rtf)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
saveFormatFormat文档格式(Docx、Txt、Pdf、PdfNoImg、Xlsx、Xml、Json、Rtf)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Xml、Json)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)

允许从带有拼写检查校正的 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Xml、Json)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。
languageSpellCheckLanguageSpellCheckLanguage 枚举值。

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Xml、Json)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

允许从 RecognitionResult 对象列表获取多页文档。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Xml、Json)。
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>列出 RecognitionResult 对象。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

close()

public void close()