Class TextExtractorOptions
Содержание
[
Скрывать
]TextExtractorOptions class
Представляет параметры извлечения текста для плагина TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions
Constructors
Name | Description |
---|---|
TextExtractorOptions() | Инициализирует новый экземпляр объекта TextExtractorOptions с режимом форматирования текста ‘Raw’ (по умолчанию). |
TextExtractorOptions(TextFormattingMode) | Инициализирует новый экземпляр объекта TextExtractorOptions для указанного режима форматирования текста. |
Properties
Name | Description |
---|---|
FormattingMode { get; } | Получает режим форматирования. |
Inputs { get; } | Возвращает коллекцию данных плагина PdfExtractor. |
override OperationName { get; } | Возвращает имя операции. |
Methods
Name | Description |
---|---|
AddInput(IDataSource) | Добавляет новый источник данных в коллекцию данных плагина PdfExtractor. |
Other Members
Name | Description |
---|---|
enum TextFormattingMode | Определяет различные режимы, которые могут быть использованы при преобразовании PDF-документа в текст. См. класс TextExtractorOptions . |
Remarks
Объект TextExtractorOptions
используется для установки TextFormattingMode
и других параметров для операции извлечения текста. Кроме того, он наследует функции для добавления данных (файлов, потоков), представляющих входные PDF-документы.
Examples
Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
See Also
- class PdfExtractorOptions
- namespace Aspose.Pdf.Plugins
- assembly Aspose.PDF