Class TextExtractor

TextExtractor class

تمثل مكون TextExtractor.

public class TextExtractor : PdfExtractor

Constructors

NameDescription
TextExtractor()المُنشئ الافتراضي.

Methods

NameDescription
Dispose()تنفيذ IDisposable. في الواقع، ليس من الضروري لمكون PdfExtractor.
Process(IPluginOptions)يبدأ معالجة PdfExtractor مع المعلمات المحددة.

Remarks

يتم استخدام كائن TextExtractor لاستخراج النص في مستندات PDF.

Examples

توضح المثال كيفية استخراج محتوى النص من مستند PDF.

// create TextExtractor object to extract text in PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions
    textExtractorOptions = new TextExtractorOptions();
    
    // add input file path to data sources
    textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

See Also