Class TextExtractorOptions
Contenido
[
Ocultar
]Clase TextExtractorOptions
Representa opciones de extracción de texto para el plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions
Constructores
Nombre | Descripción |
---|---|
TextExtractorOptions() | Inicializa una nueva instancia del objeto TextExtractorOptions con el modo de formato de texto ‘Raw’ (predeterminado). |
TextExtractorOptions(TextFormattingMode) | Inicializa una nueva instancia del objeto TextExtractorOptions para el modo de formato de texto especificado. |
Propiedades
Nombre | Descripción |
---|---|
FormattingMode { get; } | Obtiene el modo de formato. |
Inputs { get; } | Devuelve la colección de datos del plugin PdfExtractor. |
override OperationName { get; } | Devuelve el nombre de la operación. |
Métodos
Nombre | Descripción |
---|---|
AddInput(IDataSource) | Agrega una nueva fuente de datos a la colección de datos del plugin PdfExtractor. |
Otros Miembros
Nombre | Descripción |
---|---|
enum TextFormattingMode | Define diferentes modos que se pueden utilizar al convertir un documento PDF en texto. Ver clase TextExtractorOptions . |
Observaciones
El objeto TextExtractorOptions
se utiliza para establecer TextFormattingMode
y otras opciones para la operación de extracción de texto. Además, hereda funciones para agregar datos (archivos, flujos) que representan documentos PDF de entrada.
Ejemplos
El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Ver También
- clase PdfExtractorOptions
- espacio de nombres Aspose.Pdf.Plugins
- ensamblado Aspose.PDF