Přidat a hledat skrytý text v souboru PDF
Zavedení
V tomto tutoriálu vás provedeme podrobným průvodcem, jak přidat a prohledat skrytý text v souboru PDF pomocí Aspose.PDF for .NET. Ať už jste zkušený vývojář nebo nováček, který chce zlepšit své programovací dovednosti, tento článek vám poskytne informace, které potřebujete k začlenění funkcí skrytého textu do vašich aplikací.
Předpoklady
Než se ponoříte do kódovací části, existuje několik předpokladů, o které se musíte postarat:
Kontrolní seznam požadavků
- Visual Studio: Ujistěte se, že máte nainstalované Visual Studio. Tento kurz předpokládá, že používáte .NET Framework.
- Aspose.PDF pro .NET: Musíte mít knihovnu Aspose.PDF pro .NET. Můžete si jej stáhnoutzde.
- Základní znalost C#: Znalost programování v C# vám pomůže lépe porozumět úryvkům kódu.
Importujte balíčky
Než budete moci začít s kódem, musíte se ujistit, že importujete potřebné jmenné prostory Aspose.PDF. Jak na to:
Nastavte svůj projekt
- Otevřete Visual Studio a vytvořte nový projekt C# nebo použijte existující.
- Nainstalujte Aspose.PDF přidáním balíčku NuGet. Můžete to udělat tak, že přejdete do Správce balíčků NuGet a vyhledáte
Aspose.PDF
. - Případně si můžete knihovnu stáhnout přímo zzde a přidejte jej jako referenci do svého projektu.
Importujte požadované jmenné prostory
V horní části souboru C# importujte následující jmenné prostory:
using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
Tento krok je zásadní, protože tyto jmenné prostory obsahují třídy a metody nezbytné pro manipulaci s dokumenty PDF.
Vytvoření dokumentu PDF se skrytým textem
Nyní, když jste nastavili, pojďme si projít kroky k vytvoření dokumentu PDF, který obsahuje viditelný i neviditelný text.
Krok 1: Definujte adresář dokumentů
Nejprve budete chtít nastavit cestu, kam se PDF uloží. Tady začíná kouzlo!
string dataDir = "YOUR DOCUMENT DIRECTORY"; // Změňte to na svůj adresář
Tento řádek definuje, kam bude uložen váš vygenerovaný PDF. Nezapomeňte vyměnitYOUR DOCUMENT DIRECTORY
s vaší skutečnou cestou.
Krok 2: Vytvořte dokument PDF
Dále vytvoříme nový dokument PDF a přidáme do něj stránky.
Aspose.Pdf.Document doc = new Aspose.Pdf.Document();
Page page = doc.Pages.Add();
Zde inicializujeme nový dokument a přidáváme stránku, kam umístíme naše textové fragmenty.
Krok 3: Přidejte viditelný a skrytý text
Nyní do našeho PDF přidáme viditelný i neviditelný text.
TextFragment frag1 = new TextFragment("This is common text.");
TextFragment frag2 = new TextFragment("This is invisible text.");
V tomto úryvkufrag1
budou viditelné, zatímcofrag2
bude příště nastaveno na neviditelné.
Krok 4: Nastavte Text na Neviditelný
Chcete-li vytvořit textfrag2
neviditelný, jednoduše jej upravíteTextState
.
frag2.TextState.Invisible = true;
Nastavením této vlastnosti bude jakýkoli text spojený sfrag2
nebude vykreslen při prohlížení PDF.
Krok 5: Přidejte na stránku textové fragmenty
Nakonec přidáme tyto textové fragmenty na stránku a uložíme PDF.
page.Paragraphs.Add(frag1);
page.Paragraphs.Add(frag2);
doc.Save(dataDir + "39400_out.pdf");
doc.Dispose();
Tato část kódu přidává na stránku naše textové fragmenty. Poté dokument řádně uložíme a zlikvidujeme.
Hledání skrytého textu v PDF
Nyní, když jsme vytvořili naše PDF s viditelným i skrytým textem, jak tento skrytý text hledat? Pojďme to rozebrat.
Krok 1: Načtěte dokument PDF
Chcete-li hledat text v PDF, musíme nejprve načíst dokument, který jsme právě vytvořili.
doc = new Aspose.Pdf.Document(dataDir + "39400_out.pdf");
Krok 2: Vytvořte absorbér textových fragmentů
budeme používatTextFragmentAbsorber
zachytit všechny textové fragmenty v PDF.
TextFragmentAbsorber absorber = new TextFragmentAbsorber();
absorber.Visit(doc.Pages[1]);
Zde určíme, že chceme absorbovat všechny fragmenty textu z první stránky.
Krok 3: Iterujte fragmenty
Nyní můžeme procházet shromážděné fragmenty textu, abychom zjistili, které z nich jsou viditelné a které jsou skryté.
foreach (TextFragment fragment in absorber.TextFragments)
{
Console.WriteLine("Text '{0}' on pos {1} invisibility: {2}",
fragment.Text, fragment.Position.ToString(), fragment.TextState.Invisible);
}
Tato smyčka kontroluje každý textový fragment a vytiskne jeho obsah spolu s jeho pozicí a stavem viditelnosti. Lifragment.TextState.Invisible
je nastaveno na true, znamená to, že text je skrytý!
Krok 4: Zlikvidujte dokument
Nakonec nezapomeňte dokument po dokončení znovu zlikvidovat.
doc.Dispose();
Závěr
V tomto tutoriálu jsme prošli vzrušujícím procesem přidávání a vyhledávání skrytého textu v souborech PDF pomocí Aspose.PDF pro .NET. Naučili jsme se, jak vytvořit dokument PDF s viditelným i skrytým textem, a také jak tento skrytý text programově vyhledávat. Tato schopnost může být neuvěřitelně užitečná v různých aplikacích, ať už potřebujete ukládat důvěrné informace nebo poskytnout jedinečný uživatelský zážitek ve svých dokumentech.
Jak se blíže seznámíte s ASPose.PDF, možnosti se stanou nekonečnými. Pokračujte v experimentování a posouvejte hranice toho, čeho můžete s dokumenty PDF dosáhnout!
FAQ
Dokáže Aspose.PDF zpracovat šifrované soubory PDF?
Ano, Aspose.PDF podporuje šifrování a dešifrování dokumentů PDF. Své PDF můžete snadno zabezpečit hesly.
Je k dispozici zkušební verze pro Aspose.PDF?
Absolutně! Bezplatnou zkušební verzi si můžete stáhnout zzde.
Jaké programovací jazyky podporuje Aspose.PDF?
Aspose.PDF poskytuje podporu pro více jazyků, včetně C#, Java a Python.
Kde najdu dokumentaci k Aspose.PDF?
Máte přístup k dokumentacizde.
Jak mohu získat podporu, pokud narazím na problémy?
Pro podporu můžete navštívit fóra Asposezde.