Class TextExtractorOptions
Contenuti
[
Nascondere
]Classe TextExtractorOptions
Rappresenta le opzioni di estrazione del testo per il plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions
Costruttori
Nome | Descrizione |
---|---|
TextExtractorOptions() | Inizializza una nuova istanza dell’oggetto TextExtractorOptions con la modalità di formattazione del testo ‘Raw’ (predefinita). |
TextExtractorOptions(TextFormattingMode) | Inizializza una nuova istanza dell’oggetto TextExtractorOptions per la modalità di formattazione del testo specificata. |
Proprietà
Nome | Descrizione |
---|---|
FormattingMode { get; } | Ottiene la modalità di formattazione. |
Inputs { get; } | Restituisce la raccolta di dati del plugin PdfExtractor. |
override OperationName { get; } | Restituisce il nome dell’operazione. |
Metodi
Nome | Descrizione |
---|---|
AddInput(IDataSource) | Aggiunge una nuova sorgente di dati alla raccolta di dati del plugin PdfExtractor. |
Altri Membri
Nome | Descrizione |
---|---|
enum TextFormattingMode | Definisce diverse modalità che possono essere utilizzate durante la conversione di un documento PDF in testo. Vedi la classe TextExtractorOptions . |
Osservazioni
L’oggetto TextExtractorOptions
viene utilizzato per impostare TextFormattingMode
e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, flussi) che rappresentano documenti PDF di input.
Esempi
L’esempio dimostra come estrarre il contenuto testuale di un documento PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Vedi Anche
- classe PdfExtractorOptions
- namespace Aspose.Pdf.Plugins
- assembly Aspose.PDF