Class TextExtractorOptions

Clase TextExtractorOptions

Representa opciones de extracción de texto para el plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions

Constructores

NombreDescripción
TextExtractorOptions()Inicializa una nueva instancia del objeto TextExtractorOptions con el modo de formato de texto ‘Raw’ (predeterminado).
TextExtractorOptions(TextFormattingMode)Inicializa una nueva instancia del objeto TextExtractorOptions para el modo de formato de texto especificado.

Propiedades

NombreDescripción
FormattingMode { get; }Obtiene el modo de formato.
Inputs { get; }Devuelve la colección de datos del plugin PdfExtractor.
override OperationName { get; }Devuelve el nombre de la operación.

Métodos

NombreDescripción
AddInput(IDataSource)Agrega una nueva fuente de datos a la colección de datos del plugin PdfExtractor.

Otros Miembros

NombreDescripción
enum TextFormattingModeDefine diferentes modos que se pueden utilizar al convertir un documento PDF en texto. Ver clase TextExtractorOptions.

Observaciones

El objeto TextExtractorOptions se utiliza para establecer TextFormattingMode y otras opciones para la operación de extracción de texto. Además, hereda funciones para agregar datos (archivos, flujos) que representan documentos PDF de entrada.

Ejemplos

El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
    
    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Ver También