Class TextExtractor

Classe TextExtractor

Représente le plugin TextExtractor.

public class TextExtractor : PdfExtractor

Constructeurs

NomDescription
TextExtractor()Le constructeur par défaut.

Méthodes

NomDescription
Dispose()Implémentation de IDisposable. En fait, ce n’est pas nécessaire pour PdfExtractor.
Process(IPluginOptions)Démarre le traitement de PdfExtractor avec les paramètres spécifiés.

Remarques

L’objet TextExtractor est utilisé pour extraire du texte dans des documents PDF.

Exemples

L’exemple démontre comment extraire le contenu textuel d’un document PDF.

// create TextExtractor object to extract text in PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();
    
    // add input file path to data sources
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Voir aussi