Class TextExtractorOptions

TextExtractorOptions-Klasse

Stellt Optionen zur Textextraktion für das TextExtractor-Plugin dar.

public sealed class TextExtractorOptions : PdfExtractorOptions

Konstruktoren

NameBeschreibung
TextExtractorOptions()Initialisiert eine neue Instanz des TextExtractorOptions-Objekts mit dem Textformatierungsmodus ‘Raw’ (Standard).
TextExtractorOptions(TextFormattingMode)Initialisiert eine neue Instanz des TextExtractorOptions-Objekts für den angegebenen Textformatierungsmodus.

Eigenschaften

NameBeschreibung
FormattingMode { get; }Gibt den Formatierungsmodus zurück.
Inputs { get; }Gibt die Datensammlung des PdfExtractor-Plugins zurück.
override OperationName { get; }Gibt den Namen der Operation zurück.

Methoden

NameBeschreibung
AddInput(IDataSource)Fügt der Datensammlung des PdfExtractor-Plugins eine neue Datenquelle hinzu.

Weitere Mitglieder

NameBeschreibung
enum TextFormattingModeDefiniert verschiedene Modi, die beim Konvertieren eines PDF-Dokuments in Text verwendet werden können. Siehe TextExtractorOptions-Klasse.

Bemerkungen

Das TextExtractorOptions-Objekt wird verwendet, um TextFormattingMode und andere Optionen für die Textextraktionsoperation festzulegen. Außerdem erbt es Funktionen zum Hinzufügen von Daten (Dateien, Streams), die Eingabe-PDF-Dokumente darstellen.

Beispiele

Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
    
    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Siehe auch