Sök efter text och rita rektangel
Denna handledning förklarar hur du använder Aspose.PDF för .NET för att söka efter specifik text i ett PDF-dokument, rita en rektangel runt den hittade texten och spara det ändrade dokumentet. Den medföljande C#-källkoden demonstrerar processen steg för steg.
Förutsättningar
Innan du fortsätter med handledningen, se till att du har följande:
- Grundläggande kunskaper i programmeringsspråket C#.
- Aspose.PDF för .NET-biblioteket installerat. Du kan hämta det från Asposes webbplats eller använda NuGet för att installera det i ditt projekt.
Steg 1: Konfigurera projektet
Börja med att skapa ett nytt C#-projekt i din föredragna integrerade utvecklingsmiljö (IDE) och lägg till en referens till Aspose.PDF för .NET-biblioteket.
Steg 2: Importera nödvändiga namnutrymmen
Lägg till följande med hjälp av direktiv i början av din C#-fil för att importera de nödvändiga namnrymden:
using Aspose.Pdf;
using Aspose.Pdf.Text;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;
Steg 3: Ställ in sökvägen till dokumentkatalogen
Ställ in sökvägen till din dokumentkatalog med hjälp avdataDir
variabel:
string dataDir = "YOUR DOCUMENT DIRECTORY";
Byta ut"YOUR DOCUMENT DIRECTORY"
med den faktiska sökvägen till din dokumentkatalog.
Steg 4: Ladda PDF-dokumentet
Ladda PDF-dokumentet med hjälp avDocument
klass:
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
Byta ut"SearchAndGetTextFromAll.pdf"
med det faktiska namnet på din PDF-fil.
Steg 5: Skapa en TextFragmentAbsorber
Skapa enTextFragmentAbsorber
objekt för att hitta alla instanser av den inmatade sökfrasen:
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
Byta ut@"[\S]+"
med ditt önskade reguljära uttrycksmönster.
Steg 6: Aktivera sökning i reguljära uttryck
Aktivera sökning efter reguljära uttryck genom att ställa inTextSearchOptions
absorbatorns egenskaper:
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
Steg 7: Sök på alla sidor
Acceptera absorbenten för alla sidor i dokumentet:
document.Pages.Accept(textAbsorber);
Steg 8: Rita en rektangel runt den hittade texten
Skapa enPdfContentEditor
objekt och loop genom de hämtade textfragmenten, rita en rektangel runt varje textsegment:
var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
foreach (TextSegment textSegment in textFragment.Segments)
{
DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
}
}
Steg 9: Spara det ändrade dokumentet
Spara det ändrade dokumentet:
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Se till att byta ut"SearchTextAndDrawRectangle_out.pdf"
med önskat utdatafilnamn.
Exempel på källkod för Sök text och rita rektangel med Aspose.PDF för .NET
// Sökvägen till dokumentkatalogen.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Öppna dokumentet
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
// Skapa TextAbsorber-objekt för att hitta alla fraser som matchar det reguljära uttrycket
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
document.Pages.Accept(textAbsorber);
var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
foreach (TextSegment textSegment in textFragment.Segments)
{
DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
}
}
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);
Slutsats
Grattis! Du har framgångsrikt lärt dig hur du söker efter specifik text i ett PDF-dokument, ritar en rektangel runt den hittade texten och sparar det modifierade dokumentet med Aspose.PDF för .NET. Denna handledning gav en steg-för-steg-guide, från att ställa in projektet till att utföra de nödvändiga åtgärderna. Du kan nu infoga den här koden i dina egna C#-projekt för att manipulera text och rita rektanglar i PDF-filer.
FAQ’s
F: Vad är syftet med handledningen “Sök text och rita rektangel”?
S: Handledningen “Sök text och rita rektangel” syftar till att vägleda användare genom processen att använda Aspose.PDF-biblioteket för .NET för att söka efter specifik text i ett PDF-dokument, rita rektanglar runt de hittade textsegmenten och spara de modifierade dokumentera. Handledningen innehåller detaljerade instruktioner och C#-kodexempel för att illustrera varje steg i processen.
F: Hur hjälper den här handledningen till att rita rektanglar runt specifik text i ett PDF-dokument?
S: Den här handledningen ger en omfattande guide om hur du hittar och ritar rektanglar runt specifika textsegment i ett PDF-dokument. Den demonstrerar processen att ställa in ett projekt, ladda ett PDF-dokument, möjliggöra sökning i reguljära uttryck, rita rektanglar runt hittade textsegment och spara den modifierade PDF-filen.
F: Vilka förutsättningar krävs för att följa denna handledning?
S: Innan du startar handledningen bör du ha en grundläggande förståelse för programmeringsspråket C#. Dessutom måste du ha Aspose.PDF för .NET-biblioteket installerat. Du kan hämta det från Asposes webbplats eller installera det i ditt projekt med NuGet.
F: Hur ställer jag in mitt projekt för att följa denna handledning?
S: Börja med att skapa ett nytt C#-projekt i din föredragna integrerade utvecklingsmiljö (IDE). Lägg sedan till en referens till Aspose.PDF för .NET-biblioteket i ditt projekt. Detta gör att du kan använda bibliotekets funktionalitet för att manipulera PDF-dokument.
F: Kan jag rita rektanglar runt specifik text med den här handledningen?
S: Ja, handledningen fokuserar på att rita rektanglar runt specifika textsegment i ett PDF-dokument. Den visar hur man lokaliserar önskad text med hjälp av reguljära uttryck, skapar rektanglar runt de identifierade textsegmenten och sparar den modifierade PDF-filen.
F: Hur kan jag specificera texten jag vill söka efter och rita rektanglar runt?
S: För att ange texten du vill söka efter och rita rektanglar runt, skapa enTextFragmentAbsorber
objekt och ställ in dess mönster med hjälp avText
parameter. Byt ut standardmönstret@"[\S]+"
i handledningens kod med ditt önskade reguljära uttrycksmönster.
F: Hur aktiverar jag sökning i reguljära uttryck efter text?
S: Reguljära uttryckssökning aktiveras genom att skapa enTextSearchOptions
objekt och ställer in dess värde tilltrue
. Tilldela detta objekt tillTextSearchOptions
egendom avTextFragmentAbsorber
exempel. Detta säkerställer att det reguljära uttrycksmönstret används under textsökning.
F: Hur ritar jag rektanglar runt den hittade texten?
S: Efter att ha identifierat textsegmenten med hjälp avTextFragmentAbsorber
, ger handledningen en loop för att iterera genom dessa segment. För varje textsegment visar handledningen hur man skapar en rektangel runt det med hjälp avDrawBox
metod och ange rektangelns utseende.
F: Vilka är stegen för att spara den modifierade PDF-filen med ritade rektanglar?
S: Efter att ha ritat rektanglar runt de önskade textsegmenten, användDocument
klassSave
metod för att spara det ändrade dokumentet. Handledningens exempelkod visar hur du sparar den redigerade PDF-filen och visar ett framgångsmeddelande.
F: Kan jag anpassa utseendet på de ritade rektanglarna?
S: Ja, du kan anpassa utseendet på de ritade rektanglarna. I handledningens exempelkod,DrawBox
Metoden används för att skapa rektanglar. Du kan ändra egenskaper som färg, stil och tjocklek för att anpassa utseendet på de ritade rektanglarna.