Class TextExtractorOptions
Contenu
[
Cacher
]Classe TextExtractorOptions
Représente les options d’extraction de texte pour le plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions
Constructeurs
Nom | Description |
---|---|
TextExtractorOptions() | Initialise une nouvelle instance de l’objet TextExtractorOptions avec le mode de formatage de texte ‘Raw’ (par défaut). |
TextExtractorOptions(TextFormattingMode) | Initialise une nouvelle instance de l’objet TextExtractorOptions pour le mode de formatage de texte spécifié. |
Propriétés
Nom | Description |
---|---|
FormattingMode { get; } | Obtient le mode de formatage. |
Inputs { get; } | Renvoie la collection de données du plugin PdfExtractor. |
override OperationName { get; } | Renvoie le nom de l’opération. |
Méthodes
Nom | Description |
---|---|
AddInput(IDataSource) | Ajoute une nouvelle source de données à la collection de données du plugin PdfExtractor. |
Autres Membres
Nom | Description |
---|---|
enum TextFormattingMode | Définit différents modes qui peuvent être utilisés lors de la conversion d’un document PDF en texte. Voir la classe TextExtractorOptions . |
Remarques
L’objet TextExtractorOptions
est utilisé pour définir TextFormattingMode
et d’autres options pour l’opération d’extraction de texte. De plus, il hérite des fonctions pour ajouter des données (fichiers, flux) représentant des documents PDF d’entrée.
Exemples
L’exemple démontre comment extraire le contenu textuel d’un document PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Voir aussi
- classe PdfExtractorOptions
- espace de noms Aspose.Pdf.Plugins
- assembly Aspose.PDF