Class PdfExtractor

PdfExtractor class

تمثل الوظائف الأساسية لاستخراج النصوص والصور وأنواع أخرى من المحتوى التي قد تحدث في صفحات مستندات PDF.

public abstract class PdfExtractor : IDisposable, IPlugin

Methods

NameDescription
Dispose()تنفيذ IDisposable. في الواقع، ليس من الضروري لفئة PdfExtractor.
Process(IPluginOptions)يبدأ معالجة PdfExtractor مع المعلمات المحددة.

Remarks

يتم استخدام كائن TextExtractor لاستخراج النصوص، أو ImageExtractor لاستخراج الصور.

Examples

المثال يوضح كيفية استخراج محتوى النص من مستند PDF.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();
    
    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

See Also