Создать PDF с тегированным текстом

Введение

В сегодняшнюю цифровую эпоху документы PDF стали одним из самых популярных форматов для обмена и отображения контента. Будь то деловые отчеты, научные статьи или руководства пользователя, PDF-файлы есть везде! Но то, что отличает хороший PDF от отличного, — это доступность и структура. Совершенно верно! Тегированные PDF-файлы облегчают для программ чтения с экрана и вспомогательных технологий понимание и навигацию по контенту. И знаете что? В этом руководстве я проведу вас через процесс создания тегированного PDF-файла с помощью Aspose.PDF для .NET, шаг за шагом!

Итак, возьмите свой любимый напиток, устраивайтесь поудобнее и окунитесь в мир тегированных PDF-файлов!

Предпосылки

Прежде чем начать, вам необходимо подготовить несколько вещей:

  1. Visual Studio - Убедитесь, что на вашем компьютере установлена Visual Studio. Вы можете использовать любую версию, которая поддерживает .NET.
  2. Aspose.PDF для .NET — Загрузите последнюю версию Aspose.PDF для .NET с сайтавеб-сайтВы также можете выбрать бесплатную пробную версию, чтобы изучить ее возможности.
  3. .NET Framework - Эти примеры будут построены для .NET. Убедитесь, что на вашем компьютере установлена совместимая версия.
  4. Базовые знания C#. Знакомство с программированием на C# пригодится вам при написании кода!

Все понял? Отлично! Давайте приступим к кодированию!

Импортные пакеты

Теперь, когда у нас есть все необходимые условия, давайте перейдем к самой интересной части: импорту необходимых пакетов. Для работы с Aspose.PDF вам определенно нужно добавить библиотеку в свой проект.

Создать новый проект

Сначала запустите Visual Studio и создайте новый проект C#.

  1. Откройте Visual Studio.
  2. Нажмите «Создать новый проект».
  3. Выберите «Консольное приложение (.NET)» и нажмите «Далее».
  4. Дайте название вашему проекту (например,TaggedPdfExample) и укажите его местоположение.
  5. Нажмите «Создать».

Добавить ссылку Aspose.PDF

Теперь добавим библиотеку Aspose.PDF:

  1. Щелкните правой кнопкой мыши по вашему проекту в обозревателе решений.
  2. Выберите «Управление пакетами NuGet».
  3. Найдите «Aspose.PDF» и установите последнюю версию.

Импорт требуемых пространств имен

В верхней части вашего основного файла программы (например,Program.cs), импортируйте следующие пространства имен:

using Aspose.Pdf.LogicalStructure;
using Aspose.Pdf.Tagged;
using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

Теперь, когда у нас все готово, давайте разберем код на удобные для восприятия части и шаг за шагом создадим PDF-файл с тегами!

Шаг 1: Определите каталог документов

Прежде чем приступить к кодированию, давайте определим каталог документа, в котором мы сохраним наш PDF-файл:

// Путь к каталогу документов.
string dataDir = "YOUR DOCUMENT DIRECTORY"; // Обновите это до вашего пути

Заменять"YOUR DOCUMENT DIRECTORY" на фактический путь, по которому вы хотите сохранить свой PDF-файл.

Шаг 2: Создайте PDF-документ

Давайте создадим новый экземпляр документа PDF. Это похоже на рисование чистого холста, на который мы будем добавлять наш контент.

// Создать PDF-документ
Document document = new Document();

Шаг 3: Получите тегированный контент для документа

Далее нам нужно получить помеченное содержимое нашего документа. Думайте о помеченном содержимом как о базовой структуре, которая делает его доступным. Вот как это сделать:

// Получите контент для работы с TaggedPdf
ITaggedContent taggedContent = document.TaggedContent;

Шаг 4: Задайте заголовок и язык документа.

Теперь давайте установим заголовок и язык нашего документа. Это очень важно для доступности!

// Установить заголовок и язык для документа
taggedContent.SetTitle("Tagged Pdf Document");
taggedContent.SetLanguage("en-US");

Шаг 5: Создание элементов структуры текстового блока

Здесь мы создадим наш контент. Мы сделаем заголовки и абзацы, как строительные блоки!

Шаг 5.1: Создание элемента заголовка

Для начала давайте создадим элемент заголовка:

// Создание текстовых блочных структурных элементов
HeaderElement headerElement = taggedContent.CreateHeaderElement();
headerElement.ActualText = "Heading 1";

Шаг 5.2: Создание элементов абзаца

Далее, давайте добавим несколько абзацев. Я добавлю несколько для вас, но вы можете настроить это в соответствии со своими потребностями!

ParagraphElement paragraphElement1 = taggedContent.CreateParagraphElement();
paragraphElement1.ActualText = "test1";

ParagraphElement paragraphElement2 = taggedContent.CreateParagraphElement();
paragraphElement2.ActualText = "test 2";

ParagraphElement paragraphElement3 = taggedContent.CreateParagraphElement();
paragraphElement3.ActualText = "test 3";

ParagraphElement paragraphElement4 = taggedContent.CreateParagraphElement();
paragraphElement4.ActualText = "test 4";

ParagraphElement paragraphElement5 = taggedContent.CreateParagraphElement();
paragraphElement5.ActualText = "test 5";

ParagraphElement paragraphElement6 = taggedContent.CreateParagraphElement();
paragraphElement6.ActualText = "test 6";

ParagraphElement paragraphElement7 = taggedContent.CreateParagraphElement();
paragraphElement7.ActualText = "test 7";

Шаг 6: Сохраните PDF-документ.

Наконец, давайте сохраним этот шедевр! Вот как сохранить ваш помеченный PDF:

// Сохранить PDF-документ
document.Save(dataDir + "PDFwithTaggedText.pdf");

Вы только что создали PDF-файл с тегами!

Заключение

Создание тегированного PDF с помощью Aspose.PDF для .NET станет проще простого, как только вы освоитесь! Это сделает ваши документы не только удобными для пользователя, но и доступными для более широкой аудитории. Упор на семантическую структуру определенно окупится, особенно если вы работаете в отраслях, где доступность контента имеет решающее значение.

Часто задаваемые вопросы

Что такое PDF-файл с тегами?

Размеченный PDF-файл содержит структурированные данные, которые облегчают навигацию по содержимому для программ чтения с экрана и вспомогательных технологий.

Нужно ли мне приобретать Aspose.PDF, чтобы использовать его?

Хотя вы можете начать с бесплатной пробной версии, для долгосрочного использования вам потребуется лицензия. Вы можете узнать большездесь.

Могу ли я настраивать элементы структуры в моем PDF-файле?

Конечно! Вы можете манипулировать различными элементами и создавать сложные структуры на основе ваших требований.

Совместим ли Aspose.PDF со всеми приложениями .NET?

Да, Aspose.PDF предназначен для работы на различных платформах .NET, включая .NET Framework, .NET Core и другие.

Где я могу найти поддержку по Aspose.PDF?

Вы можете посетитьФорум поддержки Aspose по любым вопросам или проблемам, с которыми вы столкнетесь.