OcrOutput

Inheritance: java.lang.Object, java.util.AbstractCollection, java.util.AbstractList, java.util.ArrayList

public class OcrOutput extends ArrayList<RecognitionResult>

构造函数

构造函数描述
OcrOutput()使用空集合初始化 OcrOutput 类的新实例。

方法

方法描述

| getTableData() | 返回从所有已识别页面提取的结构化表格数据。 | | save(OutputStream stream) | 以指定格式将所有识别结果保存到内存流中。 | | save(OutputStream stream, Format saveFormat) | 以指定格式将所有识别结果保存到内存流中。 | | save(OutputStream stream, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf) | 以指定格式将所有识别结果保存到内存流中。 | | save(String fullFileName) | 将所有识别结果保存到文件。 | | save(String fullFileName, Format saveFormat) | 将所有识别结果保存到文件。 | | save(String fullFileName, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf) | 将所有识别结果保存到文件。 | | savePdf(OutputStream stream) | 将所有识别结果保存到内存中的可搜索 PDF 文档中,并将原始图像嵌入为背景。 | | savePdf(OutputStream stream, String embeddedFontPath, PdfOptimizationMode optimizePdf) | 将所有识别结果保存到内存中的可搜索 PDF 文档中,并将原始图像嵌入为背景。 | | savePdf(String fullFileName) | 将所有识别结果保存到可搜索的 PDF 文件中,并将原始图像设置为背景。 | | savePdf(String fullFileName, String embeddedFontPath, PdfOptimizationMode optimizePdf) | 将所有识别结果保存到可搜索的 PDF 文件中,并将原始图像设置为背景。 |

getTableData()

public OCRTable getTableData()

返回从所有已识别页面提取的结构化表格数据。

每页包含行,每行包含带有识别文本和可选位置信息的单元格。

Returns: OCRTable - an OCRTable structure representing all tables in the document

save(OutputStream stream)

public void save(OutputStream stream)

以指定格式将所有识别结果保存到内存流中。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。

save(OutputStream stream, Format saveFormat)

public void save(OutputStream stream, Format saveFormat)

以指定格式将所有识别结果保存到内存流中。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Rtf、Json、Xml、Epub)。

save(OutputStream stream, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public void save(OutputStream stream, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf)

以指定格式将所有识别结果保存到内存流中。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Rtf、Json、Xml、Epub)。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

save(String fullFileName)

public void save(String fullFileName)

将所有识别结果保存到文件。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。

save(String fullFileName, Format saveFormat)

public void save(String fullFileName, Format saveFormat)

将所有识别结果保存到文件。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Rtf、Json、Xml、Epub)。

save(String fullFileName, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public void save(String fullFileName, Format saveFormat, String embeddedFontPath, PdfOptimizationMode optimizePdf)

将所有识别结果保存到文件。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
saveFormatFormat文档格式(Docx、Txt、Pdf、Xlsx、Rtf、Json、Xml、Epub)。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

savePdf(OutputStream stream)

public void savePdf(OutputStream stream)

将所有识别结果保存到内存中的可搜索 PDF 文档中,并将原始图像嵌入为背景。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。

savePdf(OutputStream stream, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public void savePdf(OutputStream stream, String embeddedFontPath, PdfOptimizationMode optimizePdf)

将所有识别结果保存到内存中的可搜索 PDF 文档中,并将原始图像嵌入为背景。

Parameters:

参数类型描述
streamjava.io.OutputStream用于以所选格式保存识别结果的 OutputStream。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

savePdf(String fullFileName)

public void savePdf(String fullFileName)

将所有识别结果保存到可搜索的 PDF 文件中,并将原始图像设置为背景。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。

savePdf(String fullFileName, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public void savePdf(String fullFileName, String embeddedFontPath, PdfOptimizationMode optimizePdf)

将所有识别结果保存到可搜索的 PDF 文件中,并将原始图像设置为背景。

Parameters:

参数类型描述
fullFileNamejava.lang.String用于以所选格式保存识别结果的带路径的文件名。
embeddedFontPathjava.lang.String可选。用户字体的完整路径。
optimizePdfPdfOptimizationMode通过降低背景图像的质量来减小 PDF 文件大小。默认情况下,保留原始图像质量。

size()

public int size()

Returns: int