AsposeOCR
Inheritance: java.lang.Object
All Implemented Interfaces: java.lang.AutoCloseable
public class AsposeOCR implements AutoCloseable
Hauptklasse zum Erkennen von Text aus Bildern.
Konstruktoren
| Konstruktor | Beschreibung |
|---|---|
| AsposeOCR() | Öffentlicher Konstruktor. |
Felder
| Feld | Beschreibung |
|---|---|
| DebugMode | Aktiviert den Debug‑Modus. |
| DebugModeSaveDirectory | Verzeichnis, in dem Debug‑Ergebnisse gespeichert werden. |
Methoden
| Methode | Beschreibung |
|---|---|
| CalculateSkew(OcrInput input) | Berechnet die Schrägwinkel von Bildern. |
| CompareImageTexts(String fullPath1, String fullPath2) | Prüft, ob zwei Bilder denselben Text enthalten. |
| CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings) | Prüft, ob zwei Bilder denselben Text enthalten. |
| CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase) | Prüft, ob zwei Bilder denselben Text enthalten. |
| CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language) | Korrigiert Text (ersetzt falsch geschriebene Wörter). |
| CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath) | Korrigiert Text (ersetzt falsch geschriebene Wörter). |
| DetectDefects(OcrInput input, DefectType defectType) | Findet automatisch problematische Bereiche eines Bildes, die die OCR‑Genauigkeit erheblich beeinträchtigen können. |
| DetectDocumentLayout(OcrInput input) | Analysiert das Bild und identifiziert die verschiedenen Arten von Inhaltsbereichen darin. |
| DetectLanguages(OcrInput input) | Analysiert den Text im Bild, um die darin verwendeten Sprachen zu bestimmen. |
| DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas) | Erkennt Textbereiche in Bildern. |
| DetectTables(OcrInput images) | Erkennt Tabellenbereiche in Bildern. |
| ImageHasText(String fullPath, String text) | Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält. |
| ImageHasText(String fullPath, String text, RecognitionSettings settings) | Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält. |
| ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase) | Prüft, ob das Bild das bereitgestellte Textfragment enthält. |
| ImageHasText(String fullPath, Pattern regex) | Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht. |
| ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings) | Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht. |
| ImageTextDiff(String fullPath1, String fullPath2) | Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1). |
| ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings) | Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1). |
| ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase) | Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1). |
| Recognize(OcrInput input) | Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64. |
| Recognize(OcrInput input, RecognitionSettings settings) | Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64. |
| RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings) | Erkennt Kfz‑Kennzeichen mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64. |
| RecognizeCharacters(OcrInput input) | Erkennt Symbole in Bildern. |
| RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language) | Erkennt Symbole in Bildern. |
| RecognizeFast(OcrInput input) | Erkennt Text in qualitativ hochwertigem Bild. |
| RecognizeFormula(OcrInput input, boolean detectAreas) | Erkennt mathematische Formeln aus den bereitgestellten Eingabebildern. |
| RecognizeHandwrittenText(OcrInput input) | Erkennt handgeschriebenen Text in Bildern. |
| RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings) | Erkennt Personalausweis mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64. |
| RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings) | Erkennt Rechnung mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64. |
| RecognizePassport(OcrInput input, PassportRecognitionSettings settings) | Erkennt Reisepass mit der Möglichkeit zur Angabe. |
| RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings) | Erkennt Quittungen mit der Möglichkeit zur Angabe Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64. |
| RecognizeTables(OcrInput input, Language language) | Erkennt Tabellen und Struktur, erkennt Textzellen. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten mit Rechtschreibkorrektur. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList | Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten. |
| close() |
AsposeOCR()
public AsposeOCR()
Öffentlicher Konstruktor.
DebugMode
public static boolean DebugMode
Aktiviert den Debug-Modus. Wenn aktiviert, speichert das System Zwischenergebnisse der Bildverarbeitung, wie vorverarbeitete Bilder und Bilder mit gezeichneten Textzeilen-Rechtecken.
DebugModeSaveDirectory
public static String DebugModeSaveDirectory
Verzeichnis, in dem Debug-Ergebnisse gespeichert werden. Wenn nicht festgelegt, wird standardmäßig das aktuelle Arbeitsverzeichnis verwendet.
CalculateSkew(OcrInput input)
public ArrayList<SkewOutput> CalculateSkew(OcrInput input)
Berechnet die Schrägwinkel von Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.SkewOutput> - ArrayList von Schrägwinkeln in Grad SkewOutput
CompareImageTexts(String fullPath1, String fullPath2)
public boolean CompareImageTexts(String fullPath1, String fullPath2)
Prüft, ob zwei Bilder denselben Text enthalten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)
public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings)
Prüft, ob zwei Bilder denselben Text enthalten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).
CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
public boolean CompareImageTexts(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
Prüft, ob zwei Bilder denselben Text enthalten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
| ignoreCase | boolean | Wahr - bedeutet eine case-insensitive Suche. |
Returns: boolean - Wahr, wenn die Bilder denselben Text haben (90 % Ähnlichkeit).
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)
public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language)
Korrigiert Text (ersetzt falsch geschriebene Wörter).
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| text | java.lang.String | Text für die Korrektur. |
| language | SpellCheckLanguage | Zu verwendendes Wörterbuch SpellCheckLanguage. |
Returns: java.lang.String - Text mit ersetzten Wörtern.
CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)
public String CorrectSpelling(String text, SpellCheck.SpellCheckLanguage language, String dictionaryPath)
Korrigiert Text (ersetzt falsch geschriebene Wörter).
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| text | java.lang.String | Text für die Korrektur. |
| language | SpellCheckLanguage | Zu verwendendes Wörterbuch SpellCheckLanguage. |
| dictionaryPath | java.lang.String | Vollständiger Pfad zum Benutzerdictionary (Häufigkeitsdictionary). Dateiformat des Dictionaries: Klartextdatei in UTF-8-Kodierung. Wort und Wortfrequenz sind durch ein Komma getrennt, das Wort steht in der ersten Spalte und die Frequenz in der zweiten Spalte. Jedes Wort‑Frequenz‑Paar befindet sich in einer eigenen Zeile. Eine Zeile ist definiert als eine Zeichenfolge, gefolgt von einem Zeilenumbruch ("\n"), einem Wagenrücklauf ("\r") oder einem Wagenrücklauf, dem sofort ein Zeilenumbruch folgt ("\r\n"). Jedes Wort wird in Kleinbuchstaben erwartet. |
Returns: java.lang.String - Text mit ersetzten Wörtern.
DetectDefects(OcrInput input, DefectType defectType)
public ArrayList<DefectOutput> DetectDefects(OcrInput input, DefectType defectType)
Automatisches Auffinden problematischer Bereiche eines Bildes, die die OCR‑Genauigkeit erheblich beeinträchtigen können. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
| defectType | DefectType | Die Arten von Defekten, die erkannt werden sollen DefectType. |
Returns: java.util.ArrayList<com.aspose.ocr.DefectOutput> - ArrayList von DefectOutput mit erkannten Textbereichen oder Zeilen.
DetectDocumentLayout(OcrInput input)
public ArrayList<LayoutOutput> DetectDocumentLayout(OcrInput input)
Analysiert das Bild und identifiziert die verschiedenen Arten von Inhaltsbereichen darin. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.LayoutOutput> - Erfasste Inhaltsbereiche. ArrayList von LayoutOutput
DetectLanguages(OcrInput input)
public ArrayList<LanguageDetectionOutput> DetectLanguages(OcrInput input)
Analysiert den Text im Bild, um die darin verwendeten Sprachen zu bestimmen. Dadurch kann die am besten geeignete Erkennungssprache ausgewählt werden und es unterstützt weitere Textverarbeitungsaufgaben wie Rechtschreibprüfung oder Übersetzung. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.LanguageDetectionOutput> - Gibt eine Liste der wahrscheinlichsten Sprachen zurück, nach Wahrscheinlichkeit sortiert. ArrayList von LanguageDetectionOutput
DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)
public ArrayList<RectangleOutput> DetectRectangles(OcrInput input, AreasType areasType, boolean isDetectAreas)
Erkennt Textbereiche in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
| areasType | AreasType | Bestimmt, welche Rechtecke zurückgegeben werden sollen – Zeile oder Absatz. |
| isDetectAreas | boolean | Aktiviert die automatische Erkennung von Textbereichen. |
Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList von RectangleOutput mit erkannten Textbereichen oder Zeilen.
DetectTables(OcrInput images)
public ArrayList<RectangleOutput> DetectTables(OcrInput images)
Erkennt Tabellenbereiche in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| images | OcrInput | Der Container mit Quellen.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.RectangleOutput> - ArrayList von RectangleOutput mit erkannten Tabellenbereichen.
ImageHasText(String fullPath, String text)
public boolean ImageHasText(String fullPath, String text)
Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath | java.lang.String | Pfad zum Bild. |
| text | java.lang.String | Textfragment für die Suche im Bild. |
Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.
ImageHasText(String fullPath, String text, RecognitionSettings settings)
public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings)
Prüft, ob das Bild das bereitgestellte Textfragment mit einer Groß‑/Kleinschreibung‑unabhängigen Suche enthält.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath | java.lang.String | Pfad zum Bild. |
| text | java.lang.String | Textfragment für die Suche im Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.
ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)
public boolean ImageHasText(String fullPath, String text, RecognitionSettings settings, boolean ignoreCase)
Prüft, ob das Bild das bereitgestellte Textfragment enthält.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath | java.lang.String | Pfad zum Bild. |
| text | java.lang.String | Textfragment für die Suche im Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
| ignoreCase | boolean | Wahr - bedeutet eine case-insensitive Suche. |
Returns: boolean – Wahr, wenn das Bild ein Textfragment enthält. Falsch – das Bild enthält kein Textfragment.
ImageHasText(String fullPath, Pattern regex)
public boolean ImageHasText(String fullPath, Pattern regex)
Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath | java.lang.String | Pfad zum Bild. |
| regex | java.util.regex.Pattern | java.util.regex.Pattern-Objekt mit dem angegebenen Muster und den Optionen. |
Returns: boolean – Wahr, wenn der Bildtext dem angegebenen regulären Ausdruck entspricht.
ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)
public boolean ImageHasText(String fullPath, Pattern regex, RecognitionSettings settings)
Prüft, ob der Bildtext dem bereitgestellten regulären Ausdruck entspricht.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath | java.lang.String | Pfad zum Bild. |
| regex | java.util.regex.Pattern | java.util.regex.Pattern-Objekt mit dem angegebenen Muster und den Optionen. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
Returns: boolean – Wahr, wenn der Bildtext dem angegebenen regulären Ausdruck entspricht.
ImageTextDiff(String fullPath1, String fullPath2)
public float ImageTextDiff(String fullPath1, String fullPath2)
Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)
public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings)
Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.
ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
public float ImageTextDiff(String fullPath1, String fullPath2, RecognitionSettings settings, boolean ignoreCase)
Vergleicht die Texte der beiden Bilder und gibt eine Zahl zurück, die deren Ähnlichkeit darstellt (0 bis 1).
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullPath1 | java.lang.String | Pfad zum ersten Bild. |
| fullPath2 | java.lang.String | Pfad zum zweiten Bild. |
| settings | RecognitionSettings | Erkennungseinstellungen. |
| ignoreCase | boolean | Wahr - bedeutet eine case-insensitive Suche. |
Returns: float – 0 bedeutet, dass die Texte völlig unterschiedlich sind; 1 bedeutet, dass die Texte identisch sind.
Recognize(OcrInput input)
public OcrOutput Recognize(OcrInput input)
Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
Recognize(OcrInput input, RecognitionSettings settings)
public OcrOutput Recognize(OcrInput input, RecognitionSettings settings)
Erkennt Bild mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | RecognitionSettings | RecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)
public OcrOutput RecognizeCarPlate(OcrInput input, CarPlateRecognitionSettings settings)
Erkennt Kfz‑Kennzeichen mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | CarPlateRecognitionSettings | CarPlateRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeCharacters(OcrInput input)
public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input)
Erkennt Symbole in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList von Character mit erkannten Symboldaten für jedes Bild.
RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)
public ArrayList<CharacterRecognitionResult> RecognizeCharacters(OcrInput input, DetectAreasMode detectAreasMode, Language language)
Erkennt Symbole in Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | Der Container mit Quellen.OcrInput |
| detectAreasMode | DetectAreasMode | Bestimmt den Typ des für die Flächenerkennung verwendeten neuronalen Netzwerks. |
| language | Language | Für die OCR verwendete Sprache. |
Returns: java.util.ArrayList<com.aspose.ocr.models.CharacterRecognitionResult> - ArrayList von Character mit erkannten Symboldaten.
RecognizeFast(OcrInput input)
public ArrayList<String> RecognizeFast(OcrInput input)
Erkennt Text auf qualitativ hochwertigem Bild. Verwendet keine automatische Bildschräglagenkorrektur und Flächenerkennung für Text. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput Instanz. |
Returns: java.util.ArrayList<java.lang.String> - ArrayList mit erkanntem Text.
RecognizeFormula(OcrInput input, boolean detectAreas)
public OcrOutput RecognizeFormula(OcrInput input, boolean detectAreas)
Erkennt mathematische Formeln aus den bereitgestellten Eingabebildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| detectAreas | boolean | Wenn auf true gesetzt, erkennt und isoliert automatisch Formelbereiche, bevor die Erkennung durchgeführt wird. Wenn false, wird das gesamte Bild als Formel verarbeitet. |
Returns: OcrOutput - OcrOutput list with images recognition results OcrOutput
RecognizeHandwrittenText(OcrInput input)
public OcrOutput RecognizeHandwrittenText(OcrInput input)
Erkennt handgeschriebenen Text auf Bildern. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Der Container mit Quellen.. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)
public OcrOutput RecognizeIDCard(OcrInput input, IDCardRecognitionSettings settings)
Erkennt Personalausweis mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | IDCardRecognitionSettings | IDCardRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)
public OcrOutput RecognizeInvoice(OcrInput input, InvoiceRecognitionSettings settings)
Erkennt Rechnung mit der Möglichkeit, die unterstützten Formate anzugeben: GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP‑Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | InvoiceRecognitionSettings | InvoiceRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizePassport(OcrInput input, PassportRecognitionSettings settings)
public OcrOutput RecognizePassport(OcrInput input, PassportRecognitionSettings settings)
Erkennt Reisepässe mit der Möglichkeit zur Angabe. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | PassportRecognitionSettings | PassportRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)
public OcrOutput RecognizeReceipt(OcrInput input, ReceiptRecognitionSettings settings)
Erkennt Quittungen mit der Möglichkeit zur Angabe Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| settings | ReceiptRecognitionSettings | ReceiptRecognitionSettings. |
Returns: OcrOutput - RecognitionResult list with images recognition results RecognitionResult
RecognizeTables(OcrInput input, Language language)
public ArrayList<OCRTablePage> RecognizeTables(OcrInput input, Language language)
Erkennt Tabellen und Struktur, erkennt Textzellen. Unterstützt GIF, PNG, JPEG, WBMP, TIFF, JFIF, TIFF, PDF, InputStream, BufferedImage, Ordner, Array, ZIP-Archiv, URL, Base64.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| input | OcrInput | OcrInput. Instanz. |
| language | Language | Bestimmt das bei der Erkennung verwendete Alphabet. |
Returns: java.util.ArrayList<com.aspose.ocr.models.OCRTablePage> - OCRTablePage-Listenobjekte mit erkanntem Text in Tabellen. OCRTablePage
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| Stream | java.io.OutputStream | OutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| Stream | java.io.OutputStream | OutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
| embeddedFontPath | java.lang.String | Optional. Vollständiger Pfad zur Benutzerschriftart. |
SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
public static void SaveMultipageDocument(OutputStream stream, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| Stream | java.io.OutputStream | OutputStream zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, PdfNoImg, Xlsx, Xml, Json, Rtf). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
| embeddedFontPath | java.lang.String | Optional. Vollständiger Pfad zur Benutzerschriftart. |
| optimizePdf | PdfOptimizationMode | Reduzieren Sie die PDF-Dateigröße, indem Sie die Qualität von Hintergrundbildern verringern. Standardmäßig wird die ursprüngliche Bildqualität beibehalten. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullFileName | java.lang.String | Dateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, SpellCheck.SpellCheckLanguage language)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, SpellCheck.SpellCheckLanguage language)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten mit Rechtschreibkorrektur.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullFileName | java.lang.String | Dateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
| language | SpellCheckLanguage | SpellCheckLanguage Enum-Wert. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullFileName | java.lang.String | Dateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
| embeddedFontPath | java.lang.String | Optional. Vollständiger Pfad zur Benutzerschriftart. |
SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
public static void SaveMultipageDocument(String fullFileName, Format saveFormat, ArrayList<RecognitionResult> results, String embeddedFontPath, PdfOptimizationMode optimizePdf)
Ermöglicht das Abrufen eines mehrseitigen Dokuments aus einer Liste von RecognitionResult-Objekten.
Parameters:
| Parameter | Typ | Beschreibung |
|---|---|---|
| fullFileName | java.lang.String | Dateiname mit Pfad zum Speichern des Erkennungsergebnisses im ausgewählten Format. |
| saveFormat | Format | Dokumentenformat (Docx, Txt, Pdf, Xlsx, Xml, Json). |
| results | java.util.ArrayList<com.aspose.ocr.RecognitionResult> | Liste von RecognitionResult. Objekten. |
| embeddedFontPath | java.lang.String | Optional. Vollständiger Pfad zur Benutzerschriftart. |
| optimizePdf | PdfOptimizationMode | Reduzieren Sie die PDF-Dateigröße, indem Sie die Qualität von Hintergrundbildern verringern. Standardmäßig wird die ursprüngliche Bildqualität beibehalten. |
close()
public void close()