Cerca testo e disegna rettangolo
Introduzione
Stai cercando di migliorare le tue capacità di manipolazione PDF? Vuoi imparare a cercare testo specifico nei file PDF ed evidenziarlo con un rettangolo? Hai trovato la guida perfetta! Oggi ti guiderò attraverso l’uso di Aspose.PDF per .NET per cercare testo in un documento PDF e disegnare rettangoli attorno ad esso. Questo articolo fornirà un tutorial passo dopo passo progettato con chiarezza e utilità in mente, assicurandoti di poter seguire e applicare queste tecniche ai tuoi progetti.
Prerequisiti
Prima di immergerci nel tutorial, prepariamo il necessario per garantire un flusso di lavoro fluido:
Nozioni di base di .NET: per seguire questo tutorial in modo efficace è necessario avere familiarità con la programmazione C# e con il framework .NET.
Visual Studio installato: avrai bisogno di un ambiente di sviluppo integrato (IDE) per scrivere e testare il tuo codice. Visual Studio Community è un’ottima opzione, ed è gratuito.
Aspose.PDF per .NET: devi avere la libreria Aspose.PDF installata nel tuo progetto. Puoi scaricarlaQui o considera unlicenza temporanea per funzionalità estese.
Esempio di documento PDF: per questo tutorial, avrai bisogno di un file PDF di esempio denominato
SearchAndGetTextFromAll.pdf
memorizzati nella directory del progetto.
Importa pacchetti
Per iniziare, dovrai prima importare i pacchetti necessari nel tuo progetto .NET. Segui questi passaggi:
Apri Visual Studio
Avvia Visual Studio e crea una nuova applicazione console oppure utilizzane una esistente in cui desideri implementare le funzionalità PDF.
Aggiungi Aspose.PDF al tuo progetto
- Fare clic con il pulsante destro del mouse sul progetto in Esplora soluzioni.
- Seleziona “Gestisci pacchetti NuGet”.
- Cercare
Aspose.PDF
e installare la versione più recente.
In questo modo, porrai le basi per tutte le straordinarie manipolazioni PDF che stai per eseguire.
Importazione degli spazi dei nomi
Nella parte superiore del file di programma, dovrai importare gli spazi dei nomi rilevanti dalla libreria Aspose:
using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
using System;
using Aspose.Pdf.Facades;
In questo modo sarà più semplice accedere alle classi e ai metodi all’interno della libreria Aspose.PDF per le tue attività.
Ora che hai impostato tutto, scomponiamo il processo di ricerca del testo in un PDF e di tracciamento di un rettangolo attorno ad esso in passaggi gestibili.
Passaggio 1: imposta il percorso per il documento
Per prima cosa, imposta il percorso del tuo file PDF. Assicurati di sostituireYOUR DOCUMENT DIRECTORY
con il percorso effettivo in cui ti troviSearchAndGetTextFromAll.pdf
è memorizzato.
string dataDir = "YOUR DOCUMENT DIRECTORY";
Passaggio 2: aprire il documento PDF
Quindi, crea un’istanza diDocument
classe per caricare il tuo PDF:
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
Questa riga di codice apre il file PDF specificato, consentendoti di modificarlo ulteriormente.
Passaggio 3: creare un assorbitore di testo
Ora, avrai bisogno di un modo per cercare il testo all’interno di quel documento. Per questo, utilizziamo ilTextFragmentAbsorber
:
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
L’espressione regolare@"[\S]+"
è progettato per corrispondere a qualsiasi stringa senza spazi vuoti nel PDF.
Passaggio 4: configurare le opzioni di ricerca del testo
Successivamente, dovresti impostare le opzioni di ricerca del testo:
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
Qui, iltrue
parametro significa che la ricerca sarà sensibile alle maiuscole/minuscole. Puoi impostarlo sufalse
se si desidera una ricerca senza distinzione tra maiuscole e minuscole.
Passaggio 5: accettare l’assorbitore di testo nel documento
Con il tuoTextFragmentAbsorber
e le opzioni di ricerca sono pronte, è il momento di assorbire il testo dal documento:
document.Pages.Accept(textAbsorber);
Questo metodo esamina ogni pagina del PDF per trovare frammenti di testo che corrispondono al modello specificato.
Passaggio 6: creare un PdfContentEditor
Per disegnare forme sul documento, avrai bisogno diPdfContentEditor
:
var editor = new PdfContentEditor(document);
Questo editor consente di manipolare e modificare facilmente il contenuto del PDF.
Passaggio 7: scorrere i frammenti di testo trovati
Ora, dovrai scorrere i frammenti di testo trovati per disegnare dei rettangoli attorno a essi:
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
foreach (TextSegment textSegment in textFragment.Segments)
{
DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
}
}
Questo ciclo esegue un’iterazione su ogni frammento di testo e sui relativi segmenti, chiamando unDrawBox
metodo per disegnare rettangoli.
Passaggio 8: definire il metodo DrawBox
Devi definire ilDrawBox
metodo, che gestirà la logica di disegno del rettangolo. Ecco una semplice implementazione:
private static void DrawBox(PdfContentEditor editor, int pageNumber, TextSegment textSegment, System.Drawing.Color color)
{
// Calcola le dimensioni del rettangolo in base al segmento di testo
float x = textSegment.Rectangle.LLX;
float y = textSegment.Rectangle.LLY;
float width = textSegment.Rectangle.Width;
float height = textSegment.Rectangle.Height;
// Disegna un rettangolo utilizzando i valori calcolati
editor.DrawRectangle(pageNumber, x, y, width, height, color, 1);
}
Questo metodo determina la posizione e la dimensione del rettangolo in base al rettangolo di delimitazione del segmento e utilizza l’editor per disegnarlo.
Passaggio 9: Salvare il documento modificato
Dopo aver disegnato i rettangoli attorno al testo trovato, puoi salvare il documento modificato:
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Assicuratevi che il nuovo file venga salvato con un nome diverso per evitare di sovrascrivere il documento originale.
Passaggio 10: messaggio di conferma
Infine, visualizza un messaggio di conferma sulla console per informarti che l’operazione è riuscita:
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);
Ed ecco fatto! Hai creato con successo uno script per cercare testo in un PDF ed evidenziarlo con rettangoli.
Conclusione
Congratulazioni! Hai appena sbloccato una potente abilità che può migliorare notevolmente le tue capacità di manipolazione PDF usando Aspose.PDF per .NET. Con pochi semplici passaggi, puoi cercare qualsiasi testo nel tuo documento ed evidenziarlo visivamente, rendendo i tuoi documenti PDF più interattivi e gestibili. Non esitare a sperimentare diversi modelli di espressioni regolari e opzioni di colore per rendere davvero tuo questo strumento!
Domande frequenti
Che cos’è Aspose.PDF per .NET?
Aspose.PDF per .NET è una libreria che fornisce un modo completo per creare, manipolare e convertire documenti PDF a livello di programmazione.
Posso usare Aspose.PDF gratuitamente?
Sì, Aspose offre una prova gratuita che puoi usare per testare le funzionalità della libreria. Dai un’occhiataQui.
Quale linguaggio di programmazione devo usare con Aspose.PDF per .NET?
Aspose.PDF per .NET è progettato per essere utilizzato con C# e altri linguaggi .NET.
Come posso ottenere assistenza con Aspose.PDF?
Puoi visitare il forum di supporto Aspose per ricevere assistenza su qualsiasi problema o domanda tu possa avere. Trova supportoQui.
Dove posso scaricare Aspose.PDF per .NET?
È possibile scaricare la libreria dal sito web di Aspose,Qui.