Wyszukaj tekst i narysuj prostokąt

tym samouczku wyjaśniono, jak używać Aspose.PDF dla .NET do wyszukiwania określonego tekstu w dokumencie PDF, rysowania prostokąta wokół znalezionego tekstu i zapisywania zmodyfikowanego dokumentu. Dostarczony kod źródłowy języka C# demonstruje proces krok po kroku.

Warunki wstępne

Przed kontynuowaniem samouczka upewnij się, że posiadasz następujące elementy:

  • Podstawowa znajomość języka programowania C#.
  • Zainstalowana biblioteka Aspose.PDF dla .NET. Możesz go uzyskać ze strony internetowej Aspose lub użyć NuGet, aby zainstalować go w swoim projekcie.

Krok 1: Skonfiguruj projekt

Zacznij od utworzenia nowego projektu C# w preferowanym zintegrowanym środowisku programistycznym (IDE) i dodaj odwołanie do biblioteki Aspose.PDF dla .NET.

Krok 2: Zaimportuj niezbędne przestrzenie nazw

Dodaj następujące dyrektywy using na początku pliku C#, aby zaimportować wymagane przestrzenie nazw:

using Aspose.Pdf;
using Aspose.Pdf.Text;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;

Krok 3: Ustaw ścieżkę do katalogu dokumentów

Ustaw ścieżkę do katalogu dokumentów za pomocądataDir zmienny:

string dataDir = "YOUR DOCUMENT DIRECTORY";

Zastępować"YOUR DOCUMENT DIRECTORY" z rzeczywistą ścieżką do katalogu dokumentów.

Krok 4: Załaduj dokument PDF

Załaduj dokument PDF za pomocąDocument klasa:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

Zastępować"SearchAndGetTextFromAll.pdf" z rzeczywistą nazwą pliku PDF.

Krok 5: Utwórz TextFragmentAbsorber

StwórzTextFragmentAbsorber obiekt, aby znaleźć wszystkie wystąpienia wprowadzonej frazy wyszukiwania:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

Zastępować@"[\S]+" z żądanym wzorcem wyrażenia regularnego.

Krok 6: Włącz wyszukiwanie wyrażeń regularnych

Włącz wyszukiwanie wyrażeń regularnych, ustawiającTextSearchOptions właściwość absorbera:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

Krok 7: Wyszukaj na wszystkich stronach

Zaakceptuj absorber dla wszystkich stron dokumentu:

document.Pages.Accept(textAbsorber);

Krok 8: Narysuj prostokąt wokół znalezionego tekstu

StwórzPdfContentEditor obiektu i przeglądaj pobrane fragmenty tekstu, rysując prostokąt wokół każdego segmentu tekstu:

var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

Krok 9: Zapisz zmodyfikowany dokument

Zapisz zmodyfikowany dokument:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

Pamiętaj o wymianie"SearchTextAndDrawRectangle_out.pdf" z żądaną nazwą pliku wyjściowego.

Przykładowy kod źródłowy wyszukiwania tekstu i rysowania prostokąta przy użyciu Aspose.PDF dla .NET

// Ścieżka do katalogu dokumentów.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Otwórz dokument
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
// Utwórz obiekt TextAbsorber, aby znaleźć wszystkie frazy pasujące do wyrażenia regularnego
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
document.Pages.Accept(textAbsorber); 
var editor = new PdfContentEditor(document); 
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
			DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
	}
}
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

Wniosek

Gratulacje! Pomyślnie nauczyłeś się wyszukiwać określony tekst w dokumencie PDF, rysować prostokąt wokół znalezionego tekstu i zapisywać zmodyfikowany dokument za pomocą Aspose.PDF dla .NET. Ten samouczek zawiera przewodnik krok po kroku, od skonfigurowania projektu do wykonania wymaganych działań. Możesz teraz włączyć ten kod do własnych projektów C#, aby manipulować tekstem i rysować prostokąty w plikach PDF.

Często zadawane pytania

P: Jaki jest cel samouczka „Wyszukaj tekst i narysuj prostokąt”?

O: Samouczek „Wyszukaj tekst i narysuj prostokąt” ma na celu poprowadzenie użytkowników przez proces korzystania z biblioteki Aspose.PDF dla platformy .NET w celu wyszukiwania określonego tekstu w dokumencie PDF, rysowania prostokątów wokół znalezionych segmentów tekstu i zapisywania zmodyfikowanych dokument. Samouczek zawiera szczegółowe instrukcje i przykłady kodu C# ilustrujące każdy etap procesu.

P: W jaki sposób ten samouczek pomaga w rysowaniu prostokątów wokół określonego tekstu w dokumencie PDF?

Odp.: Ten samouczek zawiera kompleksowy przewodnik dotyczący lokalizowania i rysowania prostokątów wokół określonych segmentów tekstu w dokumencie PDF. Pokazuje proces konfigurowania projektu, ładowania dokumentu PDF, umożliwiania wyszukiwania wyrażeń regularnych, rysowania prostokątów wokół znalezionych segmentów tekstu i zapisywania zmodyfikowanego pliku PDF.

P: Jakie wymagania wstępne są wymagane, aby móc skorzystać z tego samouczka?

Odp.: Przed rozpoczęciem samouczka należy posiadać podstawową wiedzę na temat języka programowania C#. Dodatkowo musisz mieć zainstalowaną bibliotekę Aspose.PDF dla .NET. Możesz go pobrać ze strony internetowej Aspose lub zainstalować w swoim projekcie za pomocą NuGet.

P: Jak skonfigurować projekt tak, aby działał zgodnie z tym samouczkiem?

Odpowiedź: Rozpocznij od utworzenia nowego projektu C# w preferowanym zintegrowanym środowisku programistycznym (IDE). Następnie dodaj do swojego projektu odwołanie do biblioteki Aspose.PDF for .NET. Umożliwi to wykorzystanie funkcjonalności biblioteki do manipulowania dokumentami PDF.

P: Czy za pomocą tego samouczka mogę rysować prostokąty wokół określonego tekstu?

Odp.: Tak, samouczek koncentruje się na rysowaniu prostokątów wokół określonych segmentów tekstu w dokumencie PDF. Pokazuje, jak zlokalizować żądany tekst za pomocą wyrażeń regularnych, utworzyć prostokąty wokół zidentyfikowanych segmentów tekstu i zapisać zmodyfikowany plik PDF.

P: Jak mogę określić tekst, który chcę wyszukać i narysować wokół niego prostokąty?

Odp.: Aby określić tekst, który chcesz wyszukać i narysować wokół niego prostokąty, utwórz plikTextFragmentAbsorber obiekt i ustaw jego wzór za pomocąText parametr. Zastąp domyślny wzór@"[\S]+" w kodzie samouczka żądanym wzorcem wyrażenia regularnego.

P: Jak włączyć wyszukiwanie tekstu za pomocą wyrażeń regularnych?

O: Wyszukiwanie wyrażeń regularnych włącza się poprzez utworzenie plikuTextSearchOptions obiekt i ustawienie jego wartości natrue . Przypisz ten obiekt doTextSearchOptions własnośćTextFragmentAbsorber instancja. Dzięki temu podczas wyszukiwania tekstu używany jest wzorzec wyrażenia regularnego.

P: Jak narysować prostokąty wokół znalezionego tekstu?

Odp.: Po zidentyfikowaniu segmentów tekstu za pomocąTextFragmentAbsorber samouczek udostępnia pętlę umożliwiającą iterację po tych segmentach. Dla każdego segmentu tekstu samouczek pokazuje, jak utworzyć wokół niego prostokąt za pomocąDrawBox metodę i określ wygląd prostokąta.

P: Jakie są kroki, aby zapisać zmodyfikowany plik PDF z narysowanymi prostokątami?

Odp.: Po narysowaniu prostokątów wokół żądanych segmentów tekstu użyj opcjiDocument klasaSave metoda zapisania zmodyfikowanego dokumentu. Przykładowy kod samouczka pokazuje, jak zapisać edytowany plik PDF i wyświetlić komunikat o powodzeniu.

P: Czy mogę dostosować wygląd rysowanych prostokątów?

Odp.: Tak, możesz dostosować wygląd rysowanych prostokątów. W przykładowym kodzie samouczka plikDrawBox metoda służy do tworzenia prostokątów. Można modyfikować właściwości, takie jak kolor, styl i grubość, aby dostosować wygląd rysowanych prostokątów.