Class PdfExtractor
Contenu
[
Cacher
]Classe PdfExtractor
Représente la fonctionnalité de base pour extraire du texte, des images et d’autres types de contenu qui peuvent apparaître sur les pages des documents PDF.
public abstract class PdfExtractor : IDisposable, IPlugin
Méthodes
Nom | Description |
---|---|
Dispose() | Implémentation de IDisposable. En réalité, ce n’est pas nécessaire pour PdfExtractor. |
Process(IPluginOptions) | Démarre le traitement de PdfExtractor avec les paramètres spécifiés. |
Remarques
L’objet TextExtractor
est utilisé pour extraire du texte, ou ImageExtractor
pour extraire des images.
Exemples
L’exemple démontre comment extraire le contenu textuel d’un document PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Voir aussi
- interface IPlugin
- namespace Aspose.Pdf.Plugins
- assembly Aspose.PDF