Class TextExtractorOptions

Classe TextExtractorOptions

Représente les options d’extraction de texte pour le plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions

Constructeurs

NomDescription
TextExtractorOptions()Initialise une nouvelle instance de l’objet TextExtractorOptions avec le mode de formatage de texte ‘Raw’ (par défaut).
TextExtractorOptions(TextFormattingMode)Initialise une nouvelle instance de l’objet TextExtractorOptions pour le mode de formatage de texte spécifié.

Propriétés

NomDescription
FormattingMode { get; }Obtient le mode de formatage.
Inputs { get; }Renvoie la collection de données du plugin PdfExtractor.
override OperationName { get; }Renvoie le nom de l’opération.

Méthodes

NomDescription
AddInput(IDataSource)Ajoute une nouvelle source de données à la collection de données du plugin PdfExtractor.

Autres Membres

NomDescription
enum TextFormattingModeDéfinit différents modes qui peuvent être utilisés lors de la conversion d’un document PDF en texte. Voir la classe TextExtractorOptions.

Remarques

L’objet TextExtractorOptions est utilisé pour définir TextFormattingMode et d’autres options pour l’opération d’extraction de texte. De plus, il hérite des fonctions pour ajouter des données (fichiers, flux) représentant des documents PDF d’entrée.

Exemples

L’exemple démontre comment extraire le contenu textuel d’un document PDF.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
    
    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Voir aussi