Class TextExtractorOptions
İçindekiler
[
Saklamak
]TextExtractorOptions sınıfı
TextExtractor eklentisi için metin çıkarım seçeneklerini temsil eder.
public sealed class TextExtractorOptions : PdfExtractorOptions
Yapıcılar
İsim | Açıklama |
---|---|
TextExtractorOptions() | ‘Raw’ (varsayılan) metin biçimlendirme modu ile TextExtractorOptions nesnesinin yeni bir örneğini başlatır. |
TextExtractorOptions(TextFormattingMode) | Belirtilen metin biçimlendirme modu için TextExtractorOptions nesnesinin yeni bir örneğini başlatır. |
Özellikler
İsim | Açıklama |
---|---|
FormattingMode { get; } | Biçimlendirme modunu alır. |
Inputs { get; } | PdfExtractor eklentisi veri koleksiyonunu döndürür. |
override OperationName { get; } | İşlemin adını döndürür. |
Yöntemler
İsim | Açıklama |
---|---|
AddInput(IDataSource) | PdfExtractor eklentisi veri koleksiyonuna yeni bir veri kaynağı ekler. |
Diğer Üyeler
İsim | Açıklama |
---|---|
enum TextFormattingMode | Bir PDF belgesini metne dönüştürürken kullanılabilecek farklı modları tanımlar. TextExtractorOptions sınıfına bakın. |
Açıklamalar
TextExtractorOptions
nesnesi, metin çıkarım işlemi için TextFormattingMode
ve diğer seçenekleri ayarlamak için kullanılır. Ayrıca, giriş PDF belgelerini temsil eden veri (dosyalar, akışlar) eklemek için işlevler miras alır.
Örnekler
Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Ayrıca Bakınız
- sınıf PdfExtractorOptions
- ad alanı Aspose.Pdf.Plugins
- derleme Aspose.PDF