Найдите текст и нарисуйте прямоугольник

В этом руководстве объясняется, как использовать Aspose.PDF для .NET для поиска определенного текста в документе PDF, нарисовать прямоугольник вокруг найденного текста и сохранить измененный документ. Приведенный исходный код C# демонстрирует процесс шаг за шагом.

Предварительные условия

Прежде чем продолжить обучение, убедитесь, что у вас есть следующее:

  • Базовые знания языка программирования C#.
  • Установлена библиотека Aspose.PDF для .NET. Вы можете получить его с веб-сайта Aspose или использовать NuGet для установки в свой проект.

Шаг 1. Настройте проект

Начните с создания нового проекта C# в предпочитаемой вами интегрированной среде разработки (IDE) и добавьте ссылку на библиотеку Aspose.PDF для .NET.

Шаг 2. Импортируйте необходимые пространства имен.

Добавьте следующие директивы using в начало файла C#, чтобы импортировать необходимые пространства имен:

using Aspose.Pdf;
using Aspose.Pdf.Text;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;

Шаг 3. Установите путь к каталогу документов.

Задайте путь к каталогу вашего документа, используяdataDir переменная:

string dataDir = "YOUR DOCUMENT DIRECTORY";

Заменять"YOUR DOCUMENT DIRECTORY" с фактическим путем к каталогу вашего документа.

Шаг 4. Загрузите PDF-документ.

Загрузите PDF-документ, используяDocument сорт:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

Заменять"SearchAndGetTextFromAll.pdf" с фактическим именем вашего PDF-файла.

Шаг 5. Создайте TextFragmentAbsorber

СоздатьTextFragmentAbsorber объект, чтобы найти все экземпляры входной поисковой фразы:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

Заменять@"[\S]+" с желаемым шаблоном регулярного выражения.

Шаг 6. Включите поиск по регулярным выражениям

Включите поиск по регулярным выражениям, установив параметрTextSearchOptions свойство абсорбера:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

Шаг 7. Поиск на всех страницах.

Примите поглотитель для всех страниц документа:

document.Pages.Accept(textAbsorber);

Шаг 8: Нарисуйте прямоугольник вокруг найденного текста.

СоздатьPdfContentEditor объект и перебираем полученные фрагменты текста, рисуя прямоугольник вокруг каждого текстового сегмента:

var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

Шаг 9. Сохраните измененный документ.

Сохраните измененный документ:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

Обязательно замените"SearchTextAndDrawRectangle_out.pdf" с желаемым именем выходного файла.

Пример исходного кода для поиска текста и рисования прямоугольника с использованием Aspose.PDF для .NET

// Путь к каталогу документов.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Открыть документ
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
// Создайте объект TextAbsorber, чтобы найти все фразы, соответствующие регулярному выражению.
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
document.Pages.Accept(textAbsorber); 
var editor = new PdfContentEditor(document); 
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
			DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
	}
}
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

Заключение

Поздравляем! Вы успешно научились искать определенный текст в PDF-документе, рисовать прямоугольник вокруг найденного текста и сохранять измененный документ с помощью Aspose.PDF для .NET. В этом руководстве представлено пошаговое руководство: от настройки проекта до выполнения необходимых действий. Теперь вы можете включить этот код в свои собственные проекты C# для управления текстом и рисования прямоугольников в файлах PDF.

Часто задаваемые вопросы

Вопрос: Какова цель урока «Найти текст и нарисовать прямоугольник»?

О: Учебное пособие «Поиск текста и рисование прямоугольника» призвано помочь пользователям в процессе использования библиотеки Aspose.PDF для .NET для поиска определенного текста в PDF-документе, рисования прямоугольников вокруг найденных текстовых сегментов и сохранения измененных документ. В руководстве представлены подробные инструкции и примеры кода C#, иллюстрирующие каждый этап процесса.

Вопрос: Как это руководство поможет нарисовать прямоугольники вокруг определенного текста в PDF-документе?

О: В этом руководстве представлено подробное руководство о том, как найти и нарисовать прямоугольники вокруг определенных текстовых сегментов в PDF-документе. Он демонстрирует процесс настройки проекта, загрузки PDF-документа, включения поиска по регулярным выражениям, рисования прямоугольников вокруг найденных текстовых сегментов и сохранения измененного PDF-файла.

Вопрос: Какие предварительные условия необходимы для изучения этого руководства?

О: Прежде чем приступить к изучению руководства, вы должны иметь базовое представление о языке программирования C#. Кроме того, вам необходимо установить библиотеку Aspose.PDF for .NET. Вы можете получить его с веб-сайта Aspose или установить в свой проект с помощью NuGet.

Вопрос: Как мне настроить свой проект для использования этого руководства?

О: Начните с создания нового проекта C# в предпочитаемой вами интегрированной среде разработки (IDE). Затем добавьте ссылку на библиотеку Aspose.PDF для .NET в свой проект. Это позволит вам использовать функции библиотеки для управления PDF-документами.

Вопрос: Могу ли я нарисовать прямоугольники вокруг определенного текста с помощью этого урока?

О: Да, в руководстве основное внимание уделяется рисованию прямоугольников вокруг определенных текстовых сегментов в PDF-документе. Он демонстрирует, как найти нужный текст с помощью регулярных выражений, создать прямоугольники вокруг определенных текстовых сегментов и сохранить измененный PDF-файл.

Вопрос: Как указать текст, который я хочу найти, и обвести его прямоугольниками?

О: Чтобы указать текст, который вы хотите найти, и нарисовать вокруг него прямоугольники, создайтеTextFragmentAbsorber объект и задайте его шаблон с помощьюText параметр. Заменить шаблон по умолчанию@"[\S]+" в коде руководства с нужным шаблоном регулярного выражения.

Вопрос: Как включить поиск текста по регулярному выражению?

О: Поиск по регулярным выражениям включается путем созданияTextSearchOptions объект и установить его значениеtrue . Назначьте этот объектTextSearchOptions собственностьTextFragmentAbsorber пример. Это гарантирует, что шаблон регулярного выражения будет использоваться во время текстового поиска.

Вопрос: Как нарисовать прямоугольники вокруг найденного текста?

A: После идентификации текстовых сегментов с помощьюTextFragmentAbsorber , в учебнике предусмотрен цикл для перебора этих сегментов. Для каждого текстового сегмента в учебнике показано, как создать вокруг него прямоугольник с помощьюDrawBox и укажите внешний вид прямоугольника.

Вопрос: Как сохранить измененный PDF-файл с нарисованными прямоугольниками?

О: После рисования прямоугольников вокруг нужных текстовых сегментов используйтеDocument классSave метод сохранения измененного документа. Пример кода в руководстве демонстрирует, как сохранить отредактированный PDF-файл и отобразить сообщение об успехе.

Вопрос: Можно ли настроить внешний вид нарисованных прямоугольников?

О: Да, вы можете настроить внешний вид нарисованных прямоугольников. В примере кода руководстваDrawBox Метод используется для создания прямоугольников. Вы можете изменить такие свойства, как цвет, стиль и толщина, чтобы настроить внешний вид нарисованных прямоугольников.