Class PdfExtractor
İçindekiler
[
Saklamak
]PdfExtractor Sınıfı
PDF belgelerinin sayfalarında meydana gelebilecek metin, resim ve diğer içerik türlerini çıkarmak için temel işlevselliği temsil eder.
public abstract class PdfExtractor : IDisposable, IPlugin
Yöntemler
İsim | Açıklama |
---|---|
Dispose() | IDisposable uygulaması. Aslında, PdfExtractor için gerekli değildir. |
Process(IPluginOptions) | Belirtilen parametrelerle PdfExtractor işlemini başlatır. |
Açıklamalar
TextExtractor
nesnesi metin çıkarmak için, veya ImageExtractor
resim çıkarmak için kullanılır.
Örnekler
Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Ayrıca Bakınız
- arayüz IPlugin
- ad alanı Aspose.Pdf.Plugins
- derleme Aspose.PDF