Class PdfExtractor

PdfExtractor Sınıfı

PDF belgelerinin sayfalarında meydana gelebilecek metin, resim ve diğer içerik türlerini çıkarmak için temel işlevselliği temsil eder.

public abstract class PdfExtractor : IDisposable, IPlugin

Yöntemler

İsimAçıklama
Dispose()IDisposable uygulaması. Aslında, PdfExtractor için gerekli değildir.
Process(IPluginOptions)Belirtilen parametrelerle PdfExtractor işlemini başlatır.

Açıklamalar

TextExtractor nesnesi metin çıkarmak için, veya ImageExtractor resim çıkarmak için kullanılır.

Örnekler

Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set instructions
    textExtractorOptions = new TextExtractorOptions();
    
    // add input file path to data sources
    textExtractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Ayrıca Bakınız