AsposeOCR
Inheritance: java.lang.Object
All Implemented Interfaces: java.lang.AutoCloseable
public class AsposeOCR implements AutoCloseable
Основной класс для распознавания текста с изображений.
Конструкторы
| Конструктор | Описание |
|---|---|
| AsposeOCR() | Публичный конструктор. |
Поля
| Поле | Описание |
|---|---|
| DebugMode | Включает режим отладки. |
| DebugModeSaveDirectory | Каталог, в котором будут сохраняться результаты отладки. |
Методы
| Метод | Описание |
|---|---|
| CalculateSkew(OcrInput input) | Вычисляет углы наклона изображений. |
| CompareImageTexts(String fullPath1, String fullPath2) | Проверяет, содержат ли два изображения один и тот же текст. |
| CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings) | Проверяет, содержат ли два изображения один и тот же текст. |
| CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase) | Проверяет, содержат ли два изображения один и тот же текст. |
| CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language) | Корректирует текст (заменяет ошибочно написанные слова). |
| CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath) | Корректирует текст (заменяет ошибочно написанные слова). |
| DetectDefects(OcrInput input, DefectType defectType) | Автоматически находит проблемные области изображения, которые могут существенно влиять на точность OCR. |
| DetectDocumentLayout(OcrInput input) | Анализирует изображение и определяет различные типы областей контента внутри него. |
| DetectLanguages(OcrInput input) | Анализирует текст на изображении, чтобы определить, на каких языках он написан. |
| DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas) | Обнаруживает текстовые области на изображениях. |
| DetectTables(OcrInput images) | Обнаруживает области таблиц на изображениях. |
| ImageHasText(String fullPath, String text) | Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра. |
| ImageHasText(String fullPath, String text, RecognitionSettings settings) | Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра. |
| ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase) | Проверяет, содержит ли изображение предоставленный фрагмент текста. |
| ImageHasText(String fullPath, Pattern regex) | Проверяет, соответствует ли текст изображения предоставленному регулярному выражению. |
| ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings) | Проверяет, соответствует ли текст изображения предоставленному регулярному выражению. |
| ImageTextDiff(String fullPath1, String fullPath2) | Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1). |
| ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings) | Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1). |
| ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase) | Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1). |
| Recognize(OcrInput input) | Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64. |
| Recognize(OcrInput input, RecognitionSettings settings) | Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64. |
| RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings) | Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64. |
| RecognizeCharacters(OcrInput input) | Обнаруживает символы на изображениях. |
| RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language) | Обнаруживает символы на изображениях. |
| RecognizeFast(OcrInput input) | Распознаёт текст на изображении высокого качества. |
| RecognizeFormula(OcrInput input, boolean detectAreas) | Распознаёт математические формулы из предоставленных входных изображений. |
| RecognizeHandwrittenText(OcrInput input) | Распознаёт рукописный текст на изображениях. |
| RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings) | Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64. |
| RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings) | Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64. |
| RecognizePassport(OcrInput input, PassportRecognitionSettings settings) | Распознает паспорт с возможностью указания. |
| RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings) | Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64. |
| RecognizeTables(OcrInput input, Language language) | Обнаруживает таблицы и структуру, распознает текстовые ячейки. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Позволяет получить многостраничный документ из списка объектов RecognitionResult. |
| close() |
AsposeOCR()
public AsposeOCR()
Публичный конструктор.
DebugMode
public static boolean DebugMode
Включает режим отладки. При включении система сохраняет промежуточные результаты обработки изображений, такие как предварительно обработанные изображения и изображения с нарисованными прямоугольниками текстовых линий.
DebugModeSaveDirectory
public static String DebugModeSaveDirectory
Каталог, в котором будут сохраняться результаты отладки. Если не указан, по умолчанию будет использоваться текущий рабочий каталог.
CalculateSkew(OcrInput input)
public ArrayList<SkewOutput> CalculateSkew(OcrInput input)
Вычисляет углы наклона изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - ArrayList углов наклона в градусах SkewOutput
CompareImageTexts(String fullPath1, String fullPath2)
public boolean CompareImageTexts(String fullPath1, String fullPath2)
Проверяет, содержат ли два изображения один и тот же текст.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)
public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)
Проверяет, содержат ли два изображения один и тот же текст.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
| settings | RecognitionSettings | Настройки распознавания. |
Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
Проверяет, содержат ли два изображения один и тот же текст.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
| settings | RecognitionSettings | Настройки распознавания. |
| ignoreCase | boolean | True - означает поиск без учёта регистра. |
Returns: boolean - True если изображения имеют одинаковый текст (90% сходства).
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)
public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)
Корректирует текст (заменяет ошибочно написанные слова).
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| text | java.lang.String | Текст для исправления. |
| language | SpellCheckLanguage | Словарь для использования SpellCheckLanguage. |
Returns: java.lang.String - Текст с заменёнными словами.
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)
public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)
Корректирует текст (заменяет ошибочно написанные слова).
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| text | java.lang.String | Текст для исправления. |
| language | SpellCheckLanguage | Словарь для использования SpellCheckLanguage. |
| dictionaryPath | java.lang.String | Полный путь к пользовательскому словарю (словарю частот). Формат файла словаря: обычный текстовый файл в кодировке UTF-8. Слово и частота слова разделяются запятой, слово ожидается в первом столбце, а частота — во втором. Каждая пара слово‑частота находится в отдельной строке. Строка определяется как последовательность символов, за которой следует перевод строки ("\n"), возврат каретки ("\r"), или возврат каретки, сразу за которым следует перевод строки ("\r\n"). Ожидается, что каждое слово будет в нижнем регистре. |
Returns: java.lang.String - Текст с заменёнными словами.
DetectDefects(OcrInput input, DefectType defectType)
public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)
Автоматически находить проблемные области изображения, которые могут существенно влиять на точность OCR. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
| defectType | DefectType | Типы дефектов, которые нужно распознать DefectType. |
Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - ArrayList из DefectOutput с обнаруженными областями текста или строками.
DetectDocumentLayout(OcrInput input)
public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)
Анализирует изображение и определяет различные типы областей содержимого внутри него. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - Обнаруженные области содержимого. ArrayList из LayoutOutput
DetectLanguages(OcrInput input)
public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)
Анализирует текст на изображении, чтобы определить, на каких языках он написан. Это позволяет выбрать наиболее подходящий язык распознавания и помогает в дальнейших задачах обработки текста, таких как проверка орфографии или перевод. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - Возвращает список наиболее вероятных языков, упорядоченных по вероятности. ArrayList из LanguageDetectionOutput
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)
public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)
Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
| areasType | AreasType | Определяет, какие прямоугольники возвращать — строки или абзацы. |
| isDetectAreas | boolean | Включить автоматическое обнаружение текстовых областей. |
Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными текстовыми областями или строками.
DetectTables(OcrInput images)
public ArrayList<RectangleOutput> DetectTables(OcrInput images)
Обнаруживает области таблиц на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| images | OcrInput | Контейнер с исходниками.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList из RectangleOutput с обнаруженными областями таблиц.
ImageHasText(String fullPath, String text)
public boolean ImageHasText(String fullPath, String text)
Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath | java.lang.String | Путь к изображению. |
| text | java.lang.String | Текстовый фрагмент для поиска на изображении. |
Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.
ImageHasText(String fullPath, String text, RecognitionSettings settings)
public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)
Проверяет, содержит ли изображение предоставленный фрагмент текста без учёта регистра.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath | java.lang.String | Путь к изображению. |
| text | java.lang.String | Текстовый фрагмент для поиска на изображении. |
| settings | RecognitionSettings | Настройки распознавания. |
Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)
public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)
Проверяет, содержит ли изображение предоставленный фрагмент текста.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath | java.lang.String | Путь к изображению. |
| text | java.lang.String | Текстовый фрагмент для поиска на изображении. |
| settings | RecognitionSettings | Настройки распознавания. |
| ignoreCase | boolean | True - означает поиск без учёта регистра. |
Returns: boolean - True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстовый фрагмент.
ImageHasText(String fullPath, Pattern regex)
public boolean ImageHasText(String fullPath, Pattern regex)
Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath | java.lang.String | Путь к изображению. |
| regex | java.util.regex.Pattern | Объект java.util.regex.Pattern с предоставленным шаблоном и параметрами. |
Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)
public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)
Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath | java.lang.String | Путь к изображению. |
| regex | java.util.regex.Pattern | Объект java.util.regex.Pattern с предоставленным шаблоном и параметрами. |
| settings | RecognitionSettings | Настройки распознавания. |
Returns: boolean — True, если текст изображения соответствует предоставленному регулярному выражению.
ImageTextDiff(String fullPath1, String fullPath2)
public float ImageTextDiff(String fullPath1, String fullPath2)
Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)
public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)
Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
| settings | RecognitionSettings | Настройки распознавания. |
Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
Сравнивает тексты на двух изображениях и возвращает число, представляющее степень их схожести (от 0 до 1).
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullPath1 | java.lang.String | Путь к первому изображению. |
| fullPath2 | java.lang.String | Путь ко второму изображению. |
| settings | RecognitionSettings | Настройки распознавания. |
| ignoreCase | boolean | True - означает поиск без учёта регистра. |
Returns: float — 0 означает, что тексты полностью различаются; 1 означает, что тексты идентичны.
Recognize(OcrInput input)
public OcrOutput Recognize(OcrInput input)
Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
Recognize(OcrInput input, RecognitionSettings settings)
public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)
Распознаёт изображение с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | RecognitionSettings | RecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)
public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)
Распознаёт номерные знаки автомобилей с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | CarPlateRecognitionSettings | CarPlateRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeCharacters(OcrInput input)
public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)
Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов для каждого изображения.
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)
public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)
Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Контейнер с исходниками.OcrInput |
| detectAreasMode | DetectAreasMode | Определяет тип нейронной сети, используемой для обнаружения областей. |
| language | Language | Язык, используемый для OCR. |
Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList объектов Character с данными обнаруженных символов.
RecognizeFast(OcrInput input)
public ArrayList<String> RecognizeFast(OcrInput input)
Распознаёт текст на изображении хорошего качества. Не использует автоматическое исправление наклона изображения и обнаружение текстовых областей. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | Экземпляр OcrInput. |
Returns: java.util.ArrayList<java.lang.String> - ArrayList с распознанным текстом.
RecognizeFormula(OcrInput input, boolean detectAreas)
public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)
Распознаёт математические формулы из предоставленных входных изображений. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| detectAreas | boolean | Если установлено в true, автоматически обнаруживает и изолирует области формул перед выполнением распознавания. Если false, обрабатывает всё изображение как формулу. |
Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput
RecognizeHandwrittenText(OcrInput input)
public OcrOutput RecognizeHandwrittenText(OcrInput input)
Распознаёт рукописный текст на изображениях. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. Контейнер с источниками.. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)
public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)
Распознаёт удостоверения личности с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | IDCardRecognitionSettings | IDCardRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)
public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)
Распознаёт счета-фактуры с возможностью указать поддерживаемые форматы GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папка, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | InvoiceRecognitionSettings | InvoiceRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)
public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)
Распознаёт паспорт с возможностью указания. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | PassportRecognitionSettings | PassportRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)
public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)
Распознает чеки с возможностью указания Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| settings | ReceiptRecognitionSettings | ReceiptRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeTables(OcrInput input, Language language)
public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)
Обнаруживает таблицы и структуру, распознаёт текстовые ячейки. Поддерживает GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, папку, массив, zip‑архив, URL, base64.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| input | OcrInput | OcrInput. экземпляр. |
| language | Language | Определяет алфавит, используемый при распознавании. |
Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - объекты списка OCRTablePage с распознанными текстами в таблицах. OCRTablePage
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| stream | java.io.OutputStream | OutputStream для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| stream | java.io.OutputStream | OutputStream для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
| embeddedFontPath | java.lang.String | Опционально. Полный путь к пользовательскому шрифту. |
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| stream | java.io.OutputStream | OutputStream для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
| embeddedFontPath | java.lang.String | Опционально. Полный путь к пользовательскому шрифту. |
| optimizePdf | PdfOptimizationMode | Уменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullFileName | java.lang.String | Имя файла с путём для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)
Позволяет получить многостраничный документ из списка объектов RecognitionResult с исправлением орфографии.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullFileName | java.lang.String | Имя файла с путём для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
| language | SpellCheckLanguage | Значение перечисления SpellCheckLanguage. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullFileName | java.lang.String | Имя файла с путём для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
| embeddedFontPath | java.lang.String | Опционально. Полный путь к пользовательскому шрифту. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
Позволяет получить многостраничный документ из списка объектов RecognitionResult.
Parameters:
| Параметр | Тип | Описание |
|---|---|---|
| fullFileName | java.lang.String | Имя файла с путём для сохранения результата распознавания в выбранном формате. |
| saveFormat | Format | Формат документа (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Список объектов RecognitionResult. |
| embeddedFontPath | java.lang.String | Опционально. Полный путь к пользовательскому шрифту. |
| optimizePdf | PdfOptimizationMode | Уменьшите размер PDF‑файла, понижая качество фоновых изображений. По умолчанию сохраняется оригинальное качество изображения. |
close()
public void close()