AsposeOCR

Inheritance: java.lang.Object

All Implemented Interfaces: java.lang.AutoCloseable

public class AsposeOCR implements AutoCloseable

Основной класс для распознавания текста с изображений.

Конструкторы

Конструктор	Описание
AsposeOCR()	Публичный конструктор.

Поля

Поле	Описание
DebugMode	Включает режим отладки.
DebugModeSaveDirectory	Каталог, в котором будут сохраняться результаты отладки.

Методы

Метод	Описание
CalculateSkew(OcrInput input)	Вычисляет углы наклона изображений.
CompareImageTexts(String fullPath1, String fullPath2)	Проверяет, содержат ли два изображения один и тот же текст.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)	Проверяет, содержат ли два изображения один и тот же текст.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)	Проверяет, содержат ли два изображения один и тот же текст.
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)	Корректирует текст (заменяет ошибочно написанные слова).
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)	Корректирует текст (заменяет ошибочно написанные слова).
DetectDefects(OcrInput input, DefectType defectType)	Автоматически находит проблемные области изображения, которые могут существенно влиять на точность OCR.
DetectDocumentLayout(OcrInput input)	Анализирует изображение и определяет различные типы областей контента внутри него.
DetectLanguages(OcrInput input)	Анализирует текст на изображении, чтобы определить, на каких языках он написан.
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)	Обнаруживает текстовые области на изображениях.
DetectTables(OcrInput images)	Обнаруживает области таблиц на изображениях.
ImageHasText(String fullPath, String text)	Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
ImageHasText(String fullPath, String text, RecognitionSettings settings)	Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)	Проверяет, содержит ли изображение предоставленный фрагмент текста.
ImageHasText(String fullPath, Pattern regex)	Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)	Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
ImageTextDiff(String fullPath1, String fullPath2)	Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)	Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)	Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
Recognize(OcrInput input)	Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Recognize(OcrInput input, RecognitionSettings settings)	Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)	Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeCharacters(OcrInput input)	Обнаруживает символы на изображениях.
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)	Обнаруживает символы на изображениях.
RecognizeFast(OcrInput input)	Распознаёт текст на изображении высокого качества.
RecognizeFormula(OcrInput input, boolean detectAreas)	Распознаёт математические формулы из предоставленных входных изображений.
RecognizeHandwrittenText(OcrInput input)	Распознаёт рукописный текст на изображениях.
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)	Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)	Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)	Распознает паспорт с возможностью указания.
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)	Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
RecognizeTables(OcrInput input, Language language)	Обнаруживает таблицы и структуру, распознает текстовые ячейки.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)	Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)	Позволяет получить многостраничный документ из списка объектов RecognitionResult.
close()

AsposeOCR()

public AsposeOCR()

Публичный конструктор.

DebugMode

public static boolean DebugMode

Включает режим отладки. При включении система сохраняет промежуточные результаты обработки изображений, такие как предварительно обработанные изображения и изображения с нарисованными прямоугольниками текстовых линий.

DebugModeSaveDirectory

public static String DebugModeSaveDirectory

Каталог, в котором будут сохраняться результаты отладки. Если не указан, по умолчанию будет использоваться текущий рабочий каталог.

CalculateSkew(OcrInput input)

public ArrayList<SkewOutput> CalculateSkew(OcrInput input)

Вычисляет углы наклона изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - ArrayList углов наклона в градусах SkewOutput

CompareImageTexts(String fullPath1, String fullPath2)

public boolean CompareImageTexts(String fullPath1, String fullPath2)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.
settings	RecognitionSettings	Настройки распознавания.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.
settings	RecognitionSettings	Настройки распознавания.
ignoreCase	boolean	True - означает поиск без учёта регистра.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

Корректирует текст (заменяет ошибочно написанные слова).

Parameters:

Параметр	Тип	Описание
text	java.lang.String	Текст для исправления.
language	SpellCheckLanguage	Словарь для использования SpellCheckLanguage.

Returns: java.lang.String - Текст с заменёнными словами.

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

Корректирует текст (заменяет ошибочно написанные слова).

Parameters:

Параметр	Тип	Описание
text	java.lang.String	Текст для исправления.
language	SpellCheckLanguage	Словарь для использования SpellCheckLanguage.
dictionaryPath	java.lang.String	Полный путь к пользовательскому словарю (словарю частот). Формат файла словаря: обычный текстовый файл в кодировке UTF-8. Слово и частота слова разделяются запятой, слово ожидается в первом столбце, а частота — во втором. Каждая пара слово‑частота находится в отдельной строке. Строка определяется как последовательность символов, за которой следует перевод строки ("\n"), возврат каретки ("\r"), или возврат каретки, сразу за которым следует перевод строки ("\r\n"). Ожидается, что каждое слово будет в нижнем регистре.

Returns: java.lang.String - Текст с заменёнными словами.

DetectDefects(OcrInput input, DefectType defectType)

public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)

Автоматически находить проблемные области изображения, которые могут существенно влиять на точность OCR. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput
defectType	DefectType	Типы дефектов, которые нужно распознать DefectType.

Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - ArrayList из DefectOutput с обнаруженными областями текста или строками.

DetectDocumentLayout(OcrInput input)

public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)

Анализирует изображение и определяет различные типы областей содержимого внутри него. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - Обнаруженные области содержимого. ArrayList из LayoutOutput

DetectLanguages(OcrInput input)

public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)

Анализирует текст на изображении, чтобы определить, на каких языках он написан. Это позволяет выбрать наиболее подходящий язык распознавания и помогает в дальнейших задачах обработки текста, таких как проверка орфографии или перевод. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - Возвращает список наиболее вероятных языков, упорядоченных по вероятности. ArrayList из LanguageDetectionOutput

DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput
areasType	AreasType	Определяет, какие прямоугольники возвращать — строки или абзацы.
isDetectAreas	boolean	Включить автоматическое обнаружение текстовых областей.

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными текстовыми областями или строками.

DetectTables(OcrInput images)

public ArrayList<RectangleOutput> DetectTables(OcrInput images)

Обнаруживает области таблиц на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
images	OcrInput	Контейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными областями таблиц.

ImageHasText(String fullPath, String text)

public boolean ImageHasText(String fullPath, String text)

Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.

Parameters:

Параметр	Тип	Описание
fullPath	java.lang.String	Путь к изображению.
text	java.lang.String	Текстовый фрагмент для поиска на изображении.

Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.

ImageHasText(String fullPath, String text, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)

Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.

Parameters:

Параметр	Тип	Описание
fullPath	java.lang.String	Путь к изображению.
text	java.lang.String	Текстовый фрагмент для поиска на изображении.
settings	RecognitionSettings	Настройки распознавания.

ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

Проверяет, содержит ли изображение предоставленный фрагмент текста.

Parameters:

Параметр	Тип	Описание
fullPath	java.lang.String	Путь к изображению.
text	java.lang.String	Текстовый фрагмент для поиска на изображении.
settings	RecognitionSettings	Настройки распознавания.
ignoreCase	boolean	True - означает поиск без учёта регистра.

ImageHasText(String fullPath, Pattern regex)

public boolean ImageHasText(String fullPath, Pattern regex)

Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.

Parameters:

Параметр	Тип	Описание
fullPath	java.lang.String	Путь к изображению.
regex	java.util.regex.Pattern	Объект java.util.regex.Pattern с предоставленным шаблоном и параметрами.

Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.

ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.

Parameters:

Параметр	Тип	Описание
fullPath	java.lang.String	Путь к изображению.
regex	java.util.regex.Pattern	Объект java.util.regex.Pattern с предоставленным шаблоном и параметрами.
settings	RecognitionSettings	Настройки распознавания.

Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.

ImageTextDiff(String fullPath1, String fullPath2)

public float ImageTextDiff(String fullPath1, String fullPath2)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.
settings	RecognitionSettings	Настройки распознавания.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

Параметр	Тип	Описание
fullPath1	java.lang.String	Путь к первому изображению.
fullPath2	java.lang.String	Путь ко второму изображению.
settings	RecognitionSettings	Настройки распознавания.
ignoreCase	boolean	True - означает поиск без учёта регистра.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

Recognize(OcrInput input)

public OcrOutput Recognize(OcrInput input)

Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

Recognize(OcrInput input, RecognitionSettings settings)

public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	RecognitionSettings	RecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	CarPlateRecognitionSettings	CarPlateRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCharacters(OcrInput input)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)

Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов для каждого изображения.

RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

Parameters:

Параметр	Тип	Описание
input	OcrInput	Контейнер с исходниками.OcrInput
detectAreasMode	DetectAreasMode	Определяет тип нейронной сети, используемой для обнаружения областей.
language	Language	Язык, используемый для OCR.

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов.

RecognizeFast(OcrInput input)

public ArrayList<String> RecognizeFast(OcrInput input)

Распознаёт текст на изображении хорошего качества. Не использует автоматическое исправление наклона изображения и обнаружение текстовых областей. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	Экземпляр OcrInput.

Returns: java.util.ArrayList<java.lang.String> - ArrayList с распознанным текстом.

RecognizeFormula(OcrInput input, boolean detectAreas)

public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)

Распознаёт математические формулы из предоставленных входных изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
detectAreas	boolean	Если установлено в true, автоматически обнаруживает и изолирует области формул перед выполнением распознавания. Если false, обрабатывает всё изображение как формулу.

Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput

RecognizeHandwrittenText(OcrInput input)

public OcrOutput RecognizeHandwrittenText(OcrInput input)

Распознаёт рукописный текст на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. Контейнер с источниками..

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	IDCardRecognitionSettings	IDCardRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	InvoiceRecognitionSettings	InvoiceRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

Распознаёт паспорт с возможностью указания. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	PassportRecognitionSettings	PassportRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
settings	ReceiptRecognitionSettings	ReceiptRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeTables(OcrInput input, Language language)

public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)

Обнаруживает таблицы и структуру, распознаёт текстовые ячейки. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

Параметр	Тип	Описание
input	OcrInput	OcrInput. экземпляр.
language	Language	Определяет алфавит, используемый при распознавании.

Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - объекты списка OCRTablePage с распознанными текстами в таблицах. OCRTablePage

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
stream	java.io.OutputStream	OutputStream для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
stream	java.io.OutputStream	OutputStream для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.
embeddedFontPath	java.lang.String	Опционально. Полный путь к пользовательскому шрифту.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
stream	java.io.OutputStream	OutputStream для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.
embeddedFontPath	java.lang.String	Опционально. Полный путь к пользовательскому шрифту.
optimizePdf	PdfOptimizationMode	Уменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
fullFileName	java.lang.String	Имя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)

Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии.

Parameters:

Параметр	Тип	Описание
fullFileName	java.lang.String	Имя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.
language	SpellCheckLanguage	Значение перечисления SpellCheckLanguage.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
fullFileName	java.lang.String	Имя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.
embeddedFontPath	java.lang.String	Опционально. Полный путь к пользовательскому шрифту.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

Параметр	Тип	Описание
fullFileName	java.lang.String	Имя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormat	Format	Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
results	java.util.ArrayList<com.aspose.ocr.RecognitionResult>	Список объектов RecognitionResult.
embeddedFontPath	java.lang.String	Опционально. Полный путь к пользовательскому шрифту.
optimizePdf	PdfOptimizationMode	Уменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

close()

public void close()

AsposeOCRException