AsposeOCR

Inheritance: java.lang.Object

All Implemented Interfaces: java.lang.AutoCloseable

public class AsposeOCR implements AutoCloseable

Hauptklasse zum Erkennen von Text aus Bildern.

Konstruktoren

KonstruktorBeschreibung
AsposeOCR()Öffentlicher Konstruktor.

Felder

FeldBeschreibung
DebugModeAktiviert den Debug‑Modus.
DebugModeSaveDirectoryVerzeichnis, in dem Debug‑Ergebnisse gespeichert werden.

Methoden

MethodeBeschreibung
CalculateSkew(OcrInput input)Berechnet die Schrägwinkel von Bildern.
CompareImageTexts(String fullPath1, String fullPath2)Prüft, ob zwei Bilder denselben Text enthalten.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)Prüft, ob zwei Bilder denselben Text enthalten.
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)Prüft, ob zwei Bilder denselben Text enthalten.
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)Korrigiert Text (ersetzt falsch geschriebene Wörter).
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)Korrigiert Text (ersetzt falsch geschriebene Wörter).
DetectDefects(OcrInput input, DefectType defectType)Findet automatisch problematische Bereiche eines Bildes, die die OCR‑Genauigkeit erheblich beeinträchtigen können.
DetectDocumentLayout(OcrInput input)Analysiert das Bild und identifiziert die verschiedenen Arten von Inhaltsbereichen darin.
DetectLanguages(OcrInput input)Analysiert den Text im Bild, um die darin verwendeten Sprachen zu bestimmen.
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)Erkennt Textbereiche in Bildern.
DetectTables(OcrInput images)Erkennt Tabellenbereiche in Bildern.
ImageHasText(String fullPath, String text)Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.
ImageHasText(String fullPath, String text, RecognitionSettings settings)Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)Prüft, ob das Bild das bereitgestellte Textfragment enthält.
ImageHasText(String fullPath, Pattern regex)Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.
ImageTextDiff(String fullPath1, String fullPath2)Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
Recognize(OcrInput input)Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Recognize(OcrInput input, RecognitionSettings settings)Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)Erkennt Kfz‑Kennzeichen mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
RecognizeCharacters(OcrInput input)Erkennt Symbole in Bildern.
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)Erkennt Symbole in Bildern.
RecognizeFast(OcrInput input)Erkennt Text in qualitativ hochwertigem Bild.
RecognizeFormula(OcrInput input, boolean detectAreas)Erkennt mathematische Formeln aus den bereitgestellten Eingabebildern.
RecognizeHandwrittenText(OcrInput input)Erkennt handgeschriebenen Text in Bildern.
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)Erkennt Personalausweis mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)Erkennt Rechnung mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)Erkennt Reisepass mit der Möglichkeit zur Angabe.
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)Erkennt Quittungen mit der Möglichkeit zur Angabe Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
RecognizeTables(OcrInput input, Language language)Erkennt Tabellen und Struktur, erkennt Textzellen.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten mit Rechtschreibkorrektur.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
close()

AsposeOCR()

public AsposeOCR()

Öffentlicher Konstruktor.

DebugMode

public static boolean DebugMode

Aktiviert den Debug-Modus. Wenn aktiviert, speichert das System Zwischenergebnisse der Bildverarbeitung, wie vorverarbeitete Bilder und Bilder mit gezeichneten Textzeilen-Rechtecken.

DebugModeSaveDirectory

public static String DebugModeSaveDirectory

Verzeichnis, in dem Debug-Ergebnisse gespeichert werden. Wenn nicht festgelegt, wird standardmäßig das aktuelle Arbeitsverzeichnis verwendet.

CalculateSkew(OcrInput input)

public ArrayList<SkewOutput> CalculateSkew(OcrInput input)

Berechnet die Schrägwinkel von Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - ArrayList von Schrägwinkeln in Grad SkewOutput

CompareImageTexts(String fullPath1, String fullPath2)

public boolean CompareImageTexts(String fullPath1, String fullPath2)

Prüft, ob zwei Bilder denselben Text enthalten.

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.

Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)

Prüft, ob zwei Bilder denselben Text enthalten.

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.
settingsRecognitionSettingsErkennungseinstellungen.

Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).

CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Prüft, ob zwei Bilder denselben Text enthalten.

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.
settingsRecognitionSettingsErkennungseinstellungen.
ignoreCasebooleanWahr - bedeutet eine case-insensitive Suche.

Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)

Korrigiert Text (ersetzt falsch geschriebene Wörter).

Parameters:

ParameterTypBeschreibung
textjava.lang.StringText für die Korrektur.
languageSpellCheckLanguageZu verwendendes Wörterbuch SpellCheckLanguage.

Returns: java.lang.String - Text mit ersetzten Wörtern.

CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)

Korrigiert Text (ersetzt falsch geschriebene Wörter).

Parameters:

ParameterTypBeschreibung
textjava.lang.StringText für die Korrektur.
languageSpellCheckLanguageZu verwendendes Wörterbuch SpellCheckLanguage.
dictionaryPathjava.lang.StringVollständiger Pfad zum Benutzerdictionary (Häufigkeitsdictionary). Dateiformat des Dictionaries: Klartextdatei in UTF-8-Kodierung. Wort und Wortfrequenz sind durch ein Komma getrennt, das Wort steht in der ersten Spalte und die Frequenz in der zweiten Spalte. Jedes Wort‑Frequenz‑Paar befindet sich in einer eigenen Zeile. Eine Zeile ist definiert als eine Zeichenfolge, gefolgt von einem Zeilenumbruch ("\n"), einem Wagenrücklauf ("\r") oder einem Wagenrücklauf, dem sofort ein Zeilenumbruch folgt ("\r\n"). Jedes Wort wird in Kleinbuchstaben erwartet.

Returns: java.lang.String - Text mit ersetzten Wörtern.

DetectDefects(OcrInput input, DefectType defectType)

public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)

Automatisches Auffinden problematischer Bereiche eines Bildes, die die OCR‑Genauigkeit erheblich beeinträchtigen können. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput
defectTypeDefectTypeDie Arten von Defekten, die erkannt werden sollen DefectType.

Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - ArrayList von DefectOutput mit erkannten Textbereichen oder Zeilen.

DetectDocumentLayout(OcrInput input)

public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)

Analysiert das Bild und identifiziert die verschiedenen Arten von Inhaltsbereichen darin. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - Erfasste Inhaltsbereiche. ArrayList von LayoutOutput

DetectLanguages(OcrInput input)

public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)

Analysiert den Text im Bild, um die darin verwendeten Sprachen zu bestimmen. Dadurch kann die am besten geeignete Erkennungssprache ausgewählt werden und es unterstützt weitere Textverarbeitungsaufgaben wie Rechtschreibprüfung oder Übersetzung. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - Gibt eine Liste der wahrscheinlichsten Sprachen zurück, nach Wahrscheinlichkeit sortiert. ArrayList von LanguageDetectionOutput

DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)

Erkennt Textbereiche in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput
areasTypeAreasTypeBestimmt, welche Rechtecke zurückgegeben werden sollen – Zeile oder Absatz.
isDetectAreasbooleanAktiviert die automatische Erkennung von Textbereichen.

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList von RectangleOutput mit erkannten Textbereichen oder Zeilen.

DetectTables(OcrInput images)

public ArrayList<RectangleOutput> DetectTables(OcrInput images)

Erkennt Tabellenbereiche in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
imagesOcrInputDer Container mit Quellen.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList von RectangleOutput mit erkannten Tabellenbereichen.

ImageHasText(String fullPath, String text)

public boolean ImageHasText(String fullPath, String text)

Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.

Parameters:

ParameterTypBeschreibung
fullPathjava.lang.StringPfad zum Bild.
textjava.lang.StringTextfragment für die Suche im Bild.

Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.

ImageHasText(String fullPath, String text, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)

Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.

Parameters:

ParameterTypBeschreibung
fullPathjava.lang.StringPfad zum Bild.
textjava.lang.StringTextfragment für die Suche im Bild.
settingsRecognitionSettingsErkennungseinstellungen.

Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.

ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)

Prüft, ob das Bild das bereitgestellte Textfragment enthält.

Parameters:

ParameterTypBeschreibung
fullPathjava.lang.StringPfad zum Bild.
textjava.lang.StringTextfragment für die Suche im Bild.
settingsRecognitionSettingsErkennungseinstellungen.
ignoreCasebooleanWahr - bedeutet eine case-insensitive Suche.

Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.

ImageHasText(String fullPath, Pattern regex)

public boolean ImageHasText(String fullPath, Pattern regex)

Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.

Parameters:

ParameterTypBeschreibung
fullPathjava.lang.StringPfad zum Bild.
regexjava.util.regex.Patternjava.util.regex.Pattern-Objekt mit dem angegebenen Muster und den Optionen.

Returns: boolean – Wahr, wenn der Bildtext dem angegebenen regulären Ausdruck entspricht.

ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)

Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.

Parameters:

ParameterTypBeschreibung
fullPathjava.lang.StringPfad zum Bild.
regexjava.util.regex.Patternjava.util.regex.Pattern-Objekt mit dem angegebenen Muster und den Optionen.
settingsRecognitionSettingsErkennungseinstellungen.

Returns: boolean – Wahr, wenn der Bildtext dem angegebenen regulären Ausdruck entspricht.

ImageTextDiff(String fullPath1, String fullPath2)

public float ImageTextDiff(String fullPath1, String fullPath2)

Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.

Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)

Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.
settingsRecognitionSettingsErkennungseinstellungen.

Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.

ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)

Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).

Parameters:

ParameterTypBeschreibung
fullPath1java.lang.StringPfad zum ersten Bild.
fullPath2java.lang.StringPfad zum zweiten Bild.
settingsRecognitionSettingsErkennungseinstellungen.
ignoreCasebooleanWahr - bedeutet eine case-insensitive Suche.

Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.

Recognize(OcrInput input)

public OcrOutput Recognize(OcrInput input)

Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

Recognize(OcrInput input, RecognitionSettings settings)

public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)

Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsRecognitionSettingsRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)

Erkennt Kfz‑Kennzeichen mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsCarPlateRecognitionSettingsCarPlateRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeCharacters(OcrInput input)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)

Erkennt Symbole in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList von Character mit erkannten Symboldaten für jedes Bild.

RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)

Erkennt Symbole in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputDer Container mit Quellen.OcrInput
detectAreasModeDetectAreasModeBestimmt den Typ des für die Flächenerkennung verwendeten neuronalen Netzwerks.
languageLanguageFür die OCR verwendete Sprache.

Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList von Character mit erkannten Symboldaten.

RecognizeFast(OcrInput input)

public ArrayList<String> RecognizeFast(OcrInput input)

Erkennt Text auf qualitativ hochwertigem Bild. Verwendet keine automatische Bildschräglagenkorrektur und Flächenerkennung für Text. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput Instanz.

Returns: java.util.ArrayList<java.lang.String> - ArrayList mit erkanntem Text.

RecognizeFormula(OcrInput input, boolean detectAreas)

public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)

Erkennt mathematische Formeln aus den bereitgestellten Eingabebildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
detectAreasbooleanWenn auf true gesetzt, erkennt und isoliert automatisch Formelbereiche, bevor die Erkennung durchgeführt wird. Wenn false, wird das gesamte Bild als Formel verarbeitet.

Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput

RecognizeHandwrittenText(OcrInput input)

public OcrOutput RecognizeHandwrittenText(OcrInput input)

Erkennt handgeschriebenen Text auf Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Der Container mit Quellen..

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)

Erkennt Personalausweis mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsIDCardRecognitionSettingsIDCardRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)

Erkennt Rechnung mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsInvoiceRecognitionSettingsInvoiceRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)

Erkennt Reisepässe mit der Möglichkeit zur Angabe. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsPassportRecognitionSettingsPassportRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)

Erkennt Quittungen mit der Möglichkeit zur Angabe Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
settingsReceiptRecognitionSettingsReceiptRecognitionSettings.

Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult

RecognizeTables(OcrInput input, Language language)

public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)

Erkennt Tabellen und Struktur, erkennt Textzellen. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.

Parameters:

ParameterTypBeschreibung
inputOcrInputOcrInput. Instanz.
languageLanguageBestimmt das bei der Erkennung verwendete Alphabet.

Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - OCRTablePage-Listenobjekte mit erkanntem Text in Tabellen. OCRTablePage

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
Streamjava.io.OutputStreamOutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
Streamjava.io.OutputStreamOutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.
embeddedFontPathjava.lang.StringOptional. Vollständiger Pfad zur Benutzerschriftart.

SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
Streamjava.io.OutputStreamOutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.
embeddedFontPathjava.lang.StringOptional. Vollständiger Pfad zur Benutzerschriftart.
optimizePdfPdfOptimizationModeReduzieren Sie die PDF-Dateigröße, indem Sie die Qualität von Hintergrundbildern verringern. Standardmäßig wird die ursprüngliche Bildqualität beibehalten.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
fullFileNamejava.lang.StringDateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten mit Rechtschreibkorrektur.

Parameters:

ParameterTypBeschreibung
fullFileNamejava.lang.StringDateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.
languageSpellCheckLanguageSpellCheckLanguage Enum-Wert.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
fullFileNamejava.lang.StringDateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.
embeddedFontPathjava.lang.StringOptional. Vollständiger Pfad zur Benutzerschriftart.

SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)

Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.

Parameters:

ParameterTypBeschreibung
fullFileNamejava.lang.StringDateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format.
saveFormatFormatDokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json).
resultsjava.util.ArrayList<com.aspose.ocr.RecognitionResult>Liste von RecognitionResult. Objekten.
embeddedFontPathjava.lang.StringOptional. Vollständiger Pfad zur Benutzerschriftart.
optimizePdfPdfOptimizationModeReduzieren Sie die PDF-Dateigröße, indem Sie die Qualität von Hintergrundbildern verringern. Standardmäßig wird die ursprüngliche Bildqualität beibehalten.

close()

public void close()