AsposeOCR

Inheritance: java.lang.Object

All Implemented Interfaces: java.lang.AutoCloseable

public class AsposeOCR implements AutoCloseable

Основной класс для распознавания текста с изображений.

Конструкторы

КонструкторОписание
AsposeOCR()Публичный конструктор.

Поля

ПолеОписание
DebugModeВключает режим отладки.
DebugModeSaveDirectoryКаталог, в котором будут сохраняться результаты отладки.

Методы

МетодОписание
CalculateSkew(OcrInput input)Вычисляет углы наклона изображений.
CompareImageTexts(String fullPath1, String fullPath2)Проверяет, содержат ли два изображения один и тот же текст.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)Проверяет, содержат ли два изображения один и тот же текст.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)Проверяет, содержат ли два изображения один и тот же текст.
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)Корректирует текст (заменяет ошибочно написанные слова).
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)Корректирует текст (заменяет ошибочно написанные слова).
DetectDefects(OcrInput input, DefectType defectType)Автоматически находит проблемные области изображения, которые могут существенно влиять на точность OCR.
DetectDocumentLayout(OcrInput input)Анализирует изображение и определяет различные типы областей контента внутри него.
DetectLanguages(OcrInput input)Анализирует текст на изображении, чтобы определить, на каких языках он написан.
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)Обнаруживает текстовые области на изображениях.
DetectTables(OcrInput images)Обнаруживает области таблиц на изображениях.
ImageHasText(String fullPath, String text)Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
ImageHasText(String fullPath, String text, RecognitionSettings settings)Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)Проверяет, содержит ли изображение предоставленный фрагмент текста.
ImageHasText(String fullPath, Pattern regex)Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
ImageTextDiff(String fullPath1, String fullPath2)Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
Recognize(OcrInput input)Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Recognize(OcrInput input, RecognitionSettings settings)Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeCharacters(OcrInput input)Обнаруживает символы на изображениях.
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)Обнаруживает символы на изображениях.
RecognizeFast(OcrInput input)Распознаёт текст на изображении высокого качества.
RecognizeFormula(OcrInput input, boolean detectAreas)Распознаёт математические формулы из предоставленных входных изображений.
RecognizeHandwrittenText(OcrInput input)Распознаёт рукописный текст на изображениях.
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)Распознает паспорт с возможностью указания.
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
RecognizeTables(OcrInput input, Language language)Обнаруживает таблицы и структуру, распознает текстовые ячейки.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)Позволяет получить многостраничный документ из списка объектов RecognitionResult.
close()

AsposeOCR()

public AsposeOCR()

Публичный конструктор.

DebugMode

public static boolean DebugMode

Включает режим отладки. При включении система сохраняет промежуточные результаты обработки изображений, такие как предварительно обработанные изображения и изображения с нарисованными прямоугольниками текстовых линий.

DebugModeSaveDirectory

public static String DebugModeSaveDirectory

Каталог, в котором будут сохраняться результаты отладки. Если не указан, по умолчанию будет использоваться текущий рабочий каталог.

CalculateSkew(OcrInput input)

public ArrayList<SkewOutput> CalculateSkew(OcrInput input)

Вычисляет углы наклона изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - ArrayList углов наклона в градусах SkewOutput

CompareImageTexts(String fullPath1, String fullPath2)

public boolean CompareImageTexts(String fullPath1, String fullPath2)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.
settingsRecognitionSettingsНастройки распознавания.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Проверяет, содержат ли два изображения один и тот же текст.

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.
settingsRecognitionSettingsНастройки распознавания.
ignoreCasebooleanTrue - означает поиск без учёта регистра.

Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

Корректирует текст (заменяет ошибочно написанные слова).

Parameters:

ПараметрТипОписание
textjava.lang.StringТекст для исправления.
languageSpellCheckLanguageСловарь для использования SpellCheckLanguage.

Returns: java.lang.String - Текст с заменёнными словами.

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

Корректирует текст (заменяет ошибочно написанные слова).

Parameters:

ПараметрТипОписание
textjava.lang.StringТекст для исправления.
languageSpellCheckLanguageСловарь для использования SpellCheckLanguage.
dictionaryPathjava.lang.StringПолный путь к пользовательскому словарю (словарю частот). Формат файла словаря: обычный текстовый файл в кодировке UTF-8. Слово и частота слова разделяются запятой, слово ожидается в первом столбце, а частота — во втором. Каждая пара слово‑частота находится в отдельной строке. Строка определяется как последовательность символов, за которой следует перевод строки ("\n"), возврат каретки ("\r"), или возврат каретки, сразу за которым следует перевод строки ("\r\n"). Ожидается, что каждое слово будет в нижнем регистре.

Returns: java.lang.String - Текст с заменёнными словами.

DetectDefects(OcrInput input, DefectType defectType)

public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)

Автоматически находить проблемные области изображения, которые могут существенно влиять на точность OCR. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput
defectTypeDefectTypeТипы дефектов, которые нужно распознать DefectType.

Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - ArrayList из DefectOutput с обнаруженными областями текста или строками.

DetectDocumentLayout(OcrInput input)

public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)

Анализирует изображение и определяет различные типы областей содержимого внутри него. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - Обнаруженные области содержимого. ArrayList из LayoutOutput

DetectLanguages(OcrInput input)

public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)

Анализирует текст на изображении, чтобы определить, на каких языках он написан. Это позволяет выбрать наиболее подходящий язык распознавания и помогает в дальнейших задачах обработки текста, таких как проверка орфографии или перевод. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - Возвращает список наиболее вероятных языков, упорядоченных по вероятности. ArrayList из LanguageDetectionOutput

DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput
areasTypeAreasTypeОпределяет, какие прямоугольники возвращать — строки или абзацы.
isDetectAreasbooleanВключить автоматическое обнаружение текстовых областей.

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными текстовыми областями или строками.

DetectTables(OcrInput images)

public ArrayList<RectangleOutput> DetectTables(OcrInput images)

Обнаруживает области таблиц на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
imagesOcrInputКонтейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными областями таблиц.

ImageHasText(String fullPath, String text)

public boolean ImageHasText(String fullPath, String text)

Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.

Parameters:

ПараметрТипОписание
fullPathjava.lang.StringПуть к изображению.
textjava.lang.StringТекстовый фрагмент для поиска на изображении.

Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.

ImageHasText(String fullPath, String text, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)

Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.

Parameters:

ПараметрТипОписание
fullPathjava.lang.StringПуть к изображению.
textjava.lang.StringТекстовый фрагмент для поиска на изображении.
settingsRecognitionSettingsНастройки распознавания.

Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.

ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

Проверяет, содержит ли изображение предоставленный фрагмент текста.

Parameters:

ПараметрТипОписание
fullPathjava.lang.StringПуть к изображению.
textjava.lang.StringТекстовый фрагмент для поиска на изображении.
settingsRecognitionSettingsНастройки распознавания.
ignoreCasebooleanTrue - означает поиск без учёта регистра.

Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.

ImageHasText(String fullPath, Pattern regex)

public boolean ImageHasText(String fullPath, Pattern regex)

Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.

Parameters:

ПараметрТипОписание
fullPathjava.lang.StringПуть к изображению.
regexjava.util.regex.PatternОбъект java.util.regex.Pattern с предоставленным шаблоном и параметрами.

Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.

ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.

Parameters:

ПараметрТипОписание
fullPathjava.lang.StringПуть к изображению.
regexjava.util.regex.PatternОбъект java.util.regex.Pattern с предоставленным шаблоном и параметрами.
settingsRecognitionSettingsНастройки распознавания.

Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.

ImageTextDiff(String fullPath1, String fullPath2)

public float ImageTextDiff(String fullPath1, String fullPath2)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.
settingsRecognitionSettingsНастройки распознавания.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).

Parameters:

ПараметрТипОписание
fullPath1java.lang.StringПуть к первому изображению.
fullPath2java.lang.StringПуть ко второму изображению.
settingsRecognitionSettingsНастройки распознавания.
ignoreCasebooleanTrue - означает поиск без учёта регистра.

Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.

Recognize(OcrInput input)

public OcrOutput Recognize(OcrInput input)

Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

Recognize(OcrInput input, RecognitionSettings settings)

public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)

Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsRecognitionSettingsRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsCarPlateRecognitionSettingsCarPlateRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCharacters(OcrInput input)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)

Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов для каждого изображения.

RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputКонтейнер с исходниками.OcrInput
detectAreasModeDetectAreasModeОпределяет тип нейронной сети, используемой для обнаружения областей.
languageLanguageЯзык, используемый для OCR.

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов.

RecognizeFast(OcrInput input)

public ArrayList<String> RecognizeFast(OcrInput input)

Распознаёт текст на изображении хорошего качества. Не использует автоматическое исправление наклона изображения и обнаружение текстовых областей. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputЭкземпляр OcrInput.

Returns: java.util.ArrayList<java.lang.String> - ArrayList с распознанным текстом.

RecognizeFormula(OcrInput input, boolean detectAreas)

public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)

Распознаёт математические формулы из предоставленных входных изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
detectAreasbooleanЕсли установлено в true, автоматически обнаруживает и изолирует области формул перед выполнением распознавания. Если false, обрабатывает всё изображение как формулу.

Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput

RecognizeHandwrittenText(OcrInput input)

public OcrOutput RecognizeHandwrittenText(OcrInput input)

Распознаёт рукописный текст на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. Контейнер с источниками..

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsIDCardRecognitionSettingsIDCardRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsInvoiceRecognitionSettingsInvoiceRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

Распознаёт паспорт с возможностью указания. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsPassportRecognitionSettingsPassportRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
settingsReceiptRecognitionSettingsReceiptRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeTables(OcrInput input, Language language)

public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)

Обнаруживает таблицы и структуру, распознаёт текстовые ячейки. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.

Parameters:

ПараметрТипОписание
inputOcrInputOcrInput. экземпляр.
languageLanguageОпределяет алфавит, используемый при распознавании.

Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - объекты списка OCRTablePage с распознанными текстами в таблицах. OCRTablePage

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
streamjava.io.OutputStreamOutputStream для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
streamjava.io.OutputStreamOutputStream для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.
embeddedFontPathjava.lang.StringОпционально. Полный путь к пользовательскому шрифту.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
streamjava.io.OutputStreamOutputStream для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.
embeddedFontPathjava.lang.StringОпционально. Полный путь к пользовательскому шрифту.
optimizePdfPdfOptimizationModeУменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
fullFileNamejava.lang.StringИмя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)

Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии.

Parameters:

ПараметрТипОписание
fullFileNamejava.lang.StringИмя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.
languageSpellCheckLanguageЗначение перечисления SpellCheckLanguage.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
fullFileNamejava.lang.StringИмя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.
embeddedFontPathjava.lang.StringОпционально. Полный путь к пользовательскому шрифту.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Позволяет получить многостраничный документ из списка объектов RecognitionResult.

Parameters:

ПараметрТипОписание
fullFileNamejava.lang.StringИмя файла с путём для сохранения результата распознавания в выбранном формате.
saveFormatFormatФормат документа (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Список объектов RecognitionResult.
embeddedFontPathjava.lang.StringОпционально. Полный путь к пользовательскому шрифту.
optimizePdfPdfOptimizationModeУменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

close()

public void close()