Class TextExtractorOptions

Classe TextExtractorOptions

Rappresenta le opzioni di estrazione del testo per il plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions

Costruttori

NomeDescrizione
TextExtractorOptions()Inizializza una nuova istanza dell’oggetto TextExtractorOptions con la modalità di formattazione del testo ‘Raw’ (predefinita).
TextExtractorOptions(TextFormattingMode)Inizializza una nuova istanza dell’oggetto TextExtractorOptions per la modalità di formattazione del testo specificata.

Proprietà

NomeDescrizione
FormattingMode { get; }Ottiene la modalità di formattazione.
Inputs { get; }Restituisce la raccolta di dati del plugin PdfExtractor.
override OperationName { get; }Restituisce il nome dell’operazione.

Metodi

NomeDescrizione
AddInput(IDataSource)Aggiunge una nuova sorgente di dati alla raccolta di dati del plugin PdfExtractor.

Altri Membri

NomeDescrizione
enum TextFormattingModeDefinisce diverse modalità che possono essere utilizzate durante la conversione di un documento PDF in testo. Vedi la classe TextExtractorOptions.

Osservazioni

L’oggetto TextExtractorOptions viene utilizzato per impostare TextFormattingMode e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, flussi) che rappresentano documenti PDF di input.

Esempi

L’esempio dimostra come estrarre il contenuto testuale di un documento PDF.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
    
    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Vedi Anche