Class TextExtractorOptions

TextExtractorOptions sınıfı

TextExtractor eklentisi için metin çıkarım seçeneklerini temsil eder.

public sealed class TextExtractorOptions : PdfExtractorOptions

Yapıcılar

İsimAçıklama
TextExtractorOptions()‘Raw’ (varsayılan) metin biçimlendirme modu ile TextExtractorOptions nesnesinin yeni bir örneğini başlatır.
TextExtractorOptions(TextFormattingMode)Belirtilen metin biçimlendirme modu için TextExtractorOptions nesnesinin yeni bir örneğini başlatır.

Özellikler

İsimAçıklama
FormattingMode { get; }Biçimlendirme modunu alır.
Inputs { get; }PdfExtractor eklentisi veri koleksiyonunu döndürür.
override OperationName { get; }İşlemin adını döndürür.

Yöntemler

İsimAçıklama
AddInput(IDataSource)PdfExtractor eklentisi veri koleksiyonuna yeni bir veri kaynağı ekler.

Diğer Üyeler

İsimAçıklama
enum TextFormattingModeBir PDF belgesini metne dönüştürürken kullanılabilecek farklı modları tanımlar. TextExtractorOptions sınıfına bakın.

Açıklamalar

TextExtractorOptions nesnesi, metin çıkarım işlemi için TextFormattingMode ve diğer seçenekleri ayarlamak için kullanılır. Ayrıca, giriş PDF belgelerini temsil eden veri (dosyalar, akışlar) eklemek için işlevler miras alır.

Örnekler

Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.

// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
    // create TextExtractorOptions object to set TextFormattingMode (Pure,  or Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
    
    // add input file path to data sources
    extractorOptions.AddInput(new FileDataSource(inputPath));
    
    // perform extraction process
    ResultContainer resultContainer = extractor.Process(extractorOptions);
    
    // get the extracted text from the ResultContainer object
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Ayrıca Bakınız