Hledat Text A Nakreslit Obdélník
Zavedení
Chcete zlepšit své dovednosti v manipulaci s PDF? Chcete se naučit vyhledávat konkrétní text v souborech PDF a zvýraznit jej obdélníkem? Dostali jste se na perfektního průvodce! Dnes vás provedu tím, jak pomocí Aspose.PDF for .NET vyhledávat text v dokumentu PDF a kreslit kolem něj obdélníky. Tento článek poskytne návod krok za krokem navržený s ohledem na srozumitelnost a užitečnost a zajistí, že budete moci tyto techniky sledovat a aplikovat na své projekty.
Předpoklady
Než se pustíme do výukového programu, připravme si, co potřebujete k zajištění hladkého pracovního postupu:
Základní porozumění .NET: Abyste mohli efektivně sledovat tento výukový program, měli byste být obeznámeni s programováním v C# a frameworkem .NET.
Visual Studio nainstalované: K psaní a testování kódu budete potřebovat integrované vývojové prostředí (IDE). Visual Studio Community je skvělá volba a je zdarma.
Aspose.PDF for .NET: Ve svém projektu musíte mít nainstalovanou knihovnu Aspose.PDF. Můžete si jej stáhnoutzde nebo zvážit adočasná licence pro rozšířené funkce.
Ukázkový dokument PDF: Pro tento výukový program budete potřebovat ukázkový soubor PDF s názvem
SearchAndGetTextFromAll.pdf
uloženy v adresáři vašeho projektu.
Importujte balíčky
Chcete-li začít, musíte nejprve importovat potřebné balíčky do svého projektu .NET. Postupujte takto:
Otevřete Visual Studio
Spusťte Visual Studio a vytvořte novou konzolovou aplikaci nebo použijte existující, kde chcete implementovat funkce PDF.
Přidejte Aspose.PDF do svého projektu
- Klepněte pravým tlačítkem myši na svůj projekt v Průzkumníku řešení.
- Vyberte „Spravovat balíčky NuGet“.
- Hledat
Aspose.PDF
a nainstalujte nejnovější verzi.
Tím vytvoříte základ pro všechny úžasné manipulace s PDF, které se chystáte provést.
Importovat jmenné prostory
V horní části souboru programu budete chtít importovat příslušné jmenné prostory z knihovny Aspose:
using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
using System;
using Aspose.Pdf.Facades;
To usnadňuje přístup ke třídám a metodám v rámci knihovny Aspose.PDF pro vaše úkoly.
Nyní, když máte vše nastaveno, pojďme si rozdělit proces hledání textu v PDF a nakreslení obdélníku kolem něj do zvládnutelných kroků.
Krok 1: Nastavte cestu pro váš dokument
Nejprve nastavte cestu k souboru PDF. Nezapomeňte vyměnitYOUR DOCUMENT DIRECTORY
se skutečnou cestou, kde jsteSearchAndGetTextFromAll.pdf
je uložen.
string dataDir = "YOUR DOCUMENT DIRECTORY";
Krok 2: Otevřete dokument PDF
Dále vytvořte instanci souboruDocument
třída pro načtení vašeho PDF:
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
Tento řádek kódu otevře zadaný soubor PDF a umožní vám s ním dále manipulovat.
Krok 3: Vytvořte absorbér textu
Nyní budete potřebovat způsob, jak hledat text v tomto dokumentu. K tomu používámeTextFragmentAbsorber
:
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
Regulární výraz@"[\S]+"
je navržen tak, aby odpovídal jakémukoli řetězci bez mezer v PDF.
Krok 4: Nakonfigurujte možnosti vyhledávání textu
Dále byste měli nastavit možnosti textového vyhledávání:
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
Tady,true
parametr znamená, že vyhledávání bude rozlišovat malá a velká písmena. Můžete to nastavit nafalse
pokud chcete vyhledávání bez rozlišení velkých a malých písmen.
Krok 5: Přijměte v dokumentu absorbér textu
S tvýmTextFragmentAbsorber
a možnosti vyhledávání jsou připraveny, je čas absorbovat text z dokumentu:
document.Pages.Accept(textAbsorber);
Tato metoda prozkoumá každou stránku ve vašem PDF a najde fragmenty textu, které odpovídají zadanému vzoru.
Krok 6: Vytvořte PdfContentEditor
Chcete-li na dokument kreslit tvary, budete potřebovatPdfContentEditor
:
var editor = new PdfContentEditor(document);
Tento editor vám umožňuje snadno manipulovat a upravovat obsah PDF.
Krok 7: Procházení nalezených textových fragmentů
Nyní budete chtít procházet nalezené fragmenty textu a nakreslit kolem nich obdélníky:
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
foreach (TextSegment textSegment in textFragment.Segments)
{
DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
}
}
Tato smyčka iteruje každý textový fragment a jeho segmenty a volá aDrawBox
metoda kreslení obdélníku.
Krok 8: Definujte metodu DrawBox
Musíte definovatDrawBox
metoda, která bude zpracovávat logiku kreslení obdélníku. Zde je jednoduchá implementace:
private static void DrawBox(PdfContentEditor editor, int pageNumber, TextSegment textSegment, System.Drawing.Color color)
{
// Vypočítejte rozměry obdélníku na základě segmentu textu
float x = textSegment.Rectangle.LLX;
float y = textSegment.Rectangle.LLY;
float width = textSegment.Rectangle.Width;
float height = textSegment.Rectangle.Height;
// Nakreslete obdélník pomocí vypočtených hodnot
editor.DrawRectangle(pageNumber, x, y, width, height, color, 1);
}
Tato metoda určuje polohu a velikost obdélníku na základě ohraničujícího obdélníku segmentu a pomocí editoru jej nakreslí.
Krok 9: Uložte upravený dokument
Po nakreslení obdélníků kolem nalezeného textu můžete upravený dokument uložit:
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Ujistěte se, že je nový soubor uložen pod odlišným názvem, aby nedošlo k přepsání původního dokumentu.
Krok 10: Potvrzující zpráva
Nakonec vytiskněte potvrzovací zprávu do konzoly, abyste věděli, že operace byla úspěšná:
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);
A tady to máte! Úspěšně jste vytvořili skript pro vyhledávání textu v PDF a jeho zvýraznění pomocí obdélníků.
Závěr
Gratuluji! Právě jste odemkli výkonnou dovednost, která může výrazně zlepšit vaše schopnosti manipulace s PDF pomocí Aspose.PDF pro .NET. Pomocí několika jednoduchých kroků můžete vyhledat jakýkoli text v dokumentu a vizuálně jej zvýraznit, díky čemuž budou vaše dokumenty PDF interaktivnější a lépe spravovatelné. Neváhejte experimentovat s různými vzory regulárních výrazů a barevnými možnostmi, abyste si tento nástroj skutečně přizpůsobili!
FAQ
Co je Aspose.PDF pro .NET?
Aspose.PDF for .NET je knihovna, která poskytuje komplexní způsob, jak programově vytvářet, manipulovat a převádět dokumenty PDF.
Mohu používat Aspose.PDF zdarma?
Ano, Aspose nabízí bezplatnou zkušební verzi, kterou můžete použít k otestování funkcí knihovny. Podívejte se na tozde.
Jaký programovací jazyk musím používat s Aspose.PDF pro .NET?
Aspose.PDF for .NET je navržen pro použití s C# a dalšími jazyky .NET.
Jak získám pomoc s Aspose.PDF?
Můžete navštívit fórum podpory Aspose, kde získáte pomoc ohledně jakéhokoli problému nebo dotazu, který můžete mít. Najděte podporuzde.
Kde si stáhnu Aspose.PDF pro .NET?
Knihovnu si můžete stáhnout z webu Aspose,zde.