Class PdfExtractor
محتويات
[
يخفي
]PdfExtractor class
تمثل الوظائف الأساسية لاستخراج النصوص والصور وأنواع أخرى من المحتوى التي قد تحدث في صفحات مستندات PDF.
public abstract class PdfExtractor : IDisposable, IPlugin
Methods
Name | Description |
---|---|
Dispose() | تنفيذ IDisposable. في الواقع، ليس من الضروري لفئة PdfExtractor. |
Process(IPluginOptions) | يبدأ معالجة PdfExtractor مع المعلمات المحددة. |
Remarks
يتم استخدام كائن TextExtractor
لاستخراج النصوص، أو ImageExtractor
لاستخراج الصور.
Examples
المثال يوضح كيفية استخراج محتوى النص من مستند PDF.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
See Also
- interface IPlugin
- namespace Aspose.Pdf.Plugins
- assembly Aspose.PDF