Tagga l'immagine nel PDF esistente
Introduzione
In questo tutorial, ti guideremo attraverso come taggare un’immagine in un PDF esistente usando Aspose.PDF per .NET. Alla fine di questa guida, sarai in grado di impostare testo alternativo per le immagini, regolare gli attributi di layout e assicurarti che il tuo PDF sia conforme agli standard di accessibilità.
Prerequisiti
Prima di iniziare, vediamo cosa ti servirà per iniziare:
- Aspose.PDF per .NET: assicurati di aver scaricato e installato l’ultima versione di Aspose.PDF per .NET.Scarica qui.
- .NET Framework: assicurati di avere configurato un ambiente di sviluppo .NET come Visual Studio.
- Nozioni di base sulla struttura del PDF: familiarità con gli elementi della struttura del PDF, quali paragrafi, intervalli, tabelle e immagini.
- Una licenza valida: puoi acquistare una licenzaQui o usarne uno temporaneoQui.
Importa pacchetti
Per iniziare a programmare, devi importare i namespace essenziali da Aspose.PDF per .NET. Questi ti daranno accesso alle classi e ai metodi necessari per manipolare il documento PDF.
using Aspose.Pdf.LogicalStructure;
using Aspose.Pdf.Tagged;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
Ora che abbiamo impostato la scena, scomponiamo il processo di taggatura di un’immagine in più passaggi.
Passaggio 1: caricare il documento PDF esistente
Il primo passo è caricare il file PDF con cui vuoi lavorare. Può essere qualsiasi file PDF con un’immagine che vuoi taggare.
// Percorso verso la directory dei documenti.
string dataDir = "YOUR DOCUMENT DIRECTORY";
string inFile = dataDir + "TH.pdf";
string outFile = dataDir + "TH_out.pdf";
string logFile = dataDir + "TH_out.xml";
// Apri il documento
Document document = new Document(inFile);
- Sostituire
"YOUR DOCUMENT DIRECTORY"
con il percorso effettivo del file. - IL
Document
class ti consente di caricare un PDF esistente. Modificherai questo PDF per taggare l’immagine.
Passaggio 2: accedere al contenuto taggato e all’elemento della struttura radice
Una volta aperto il PDF, il passo successivo è accedere al contenuto taggato e identificare l’elemento della struttura radice. Questo è fondamentale perché consente di navigare tra gli elementi nel PDF e apportare modifiche.
// Ottieni contenuto taggato ed elemento struttura radice
ITaggedContent taggedContent = document.TaggedContent;
StructureElement rootElement = taggedContent.RootElement;
TaggedContent
fornisce accesso agli elementi strutturati nel PDF.- IL
RootElement
è l’elemento strutturale più in alto, dal quale è possibile passare ad altri elementi come paragrafi, tabelle e immagini.
Passaggio 3: imposta il titolo per il documento PDF taggato
L’aggiunta di un titolo al documento PDF taggato garantisce che il documento sia etichettato correttamente, il che è utile per l’accessibilità e la conformità PDF/UA.
// Imposta il titolo per il documento PDF taggato
taggedContent.SetTitle("Document with images");
- Impostando un titolo per il PDF taggato si migliora l’accessibilità e si rende più chiaro il documento per gli screen reader e le tecnologie assistive.
Passaggio 4: trova e tagga l’immagine
Ora, troviamo l’elemento immagine (chiamatoFigureElement
in Aspose.PDF), impostare un testo alternativo e configurare gli attributi di layout.
// Passa attraverso tutti gli elementi della figura (immagini) e imposta il testo alternativo e gli attributi di layout
foreach (FigureElement figureElement in rootElement.FindElements<FigureElement>(true))
{
// Imposta testo alternativo per la figura
figureElement.AlternativeText = "Figure alternative text (technique 2)";
// Crea e imposta l'attributo BBox (riquadro delimitatore)
StructureAttribute bboxAttribute = new StructureAttribute(AttributeKey.BBox);
bboxAttribute.SetRectangleValue(new Aspose.Pdf.Rectangle(0.0, 0.0, 100.0, 100.0));
// Imposta gli attributi di layout per la figura
StructureAttributes figureLayoutAttributes = figureElement.Attributes.GetAttributes(AttributeOwnerStandard.Layout);
figureLayoutAttributes.SetAttribute(bboxAttribute);
}
- Questo codice esegue un ciclo attraverso tutti i
FigureElement
oggetti nella struttura radice, che rappresentano immagini. - Imposta il testo alternativo per l’accessibilità (gli screen reader lo utilizzeranno per descrivere l’immagine).
- Il riquadro di delimitazione (
BBox
specifica le coordinate per il layout dell’immagine, assicurandone la corretta visualizzazione nel documento.
Passaggio 5: modificare gli elementi Span all’interno della tabella
In alcuni casi, potresti dover modificare gli elementi span all’interno di una tabella. Qui, mostreremo come trovare unSpanElement
e spostarlo in un paragrafo.
// Trova gli elementi della tabella, dello span e del paragrafo
TableElement tableElement = rootElement.FindElements<TableElement>(true)[0];
SpanElement spanElement = tableElement.FindElements<SpanElement>(true)[0];
TableTDElement firstTdElement = tableElement.FindElements<TableTDElement>(true)[0];
ParagraphElement paragraph = firstTdElement.FindElements<ParagraphElement>(true)[0];
// Sposta l'elemento span nel paragrafo
spanElement.ChangeParentElement(paragraph);
- Qui, localizziamo il
TableElement
,SpanElement
, EParagraphElement
all’interno del PDF. - Utilizzando il
ChangeParentElement
metodo, spostiamo l’intervallo nel paragrafo per garantire la corretta etichettatura e struttura.
Passaggio 6: salvare il documento e convalidare la conformità PDF/UA
Una volta apportate tutte le modifiche, il passaggio finale consiste nel salvare il PDF aggiornato e verificare se è conforme agli standard PDF/UA.
// Salva il documento PDF aggiornato
document.Save(outFile);
// Convalida la conformità PDF/UA
document = new Document(outFile);
bool isPdfUaCompliance = document.Validate(logFile, PdfFormat.PDF_UA_1);
Console.WriteLine(String.Format("PDF/UA compliance: {0}", isPdfUaCompliance));
- IL
Validate
Il metodo controlla il documento PDF rispetto agli standard PDF/UA e registra i risultati. - Garantire la conformità aiuta a migliorare l’accessibilità e a soddisfare i requisiti normativi per la pubblicazione dei documenti.
Conclusione
In questo tutorial, ti abbiamo mostrato come taggare le immagini in un PDF esistente usando Aspose.PDF per .NET. Impostando testo alternativo, regolando gli attributi di layout e convalidando il documento per la conformità PDF/UA, puoi assicurarti che i tuoi PDF siano accessibili e soddisfino gli standard moderni. Aspose.PDF semplifica il lavoro con elementi strutturati, dandoti il controllo sul layout e l’accessibilità del tuo documento.
Domande frequenti
A cosa serve Aspose.PDF per .NET?
Aspose.PDF per .NET è una potente libreria utilizzata per creare, modificare e manipolare documenti PDF a livello di programmazione in un ambiente .NET.
Come posso garantire la conformità PDF/UA?
Puoi usare Aspose.PDFValidate
Metodo per verificare la conformità PDF/UA dopo aver apportato modifiche al documento.
Cos’è il testo alternativo nei PDF?
Il testo alternativo è una descrizione aggiunta alle immagini nei PDF per migliorarne l’accessibilità, soprattutto per gli utenti che utilizzano lettori di schermo.
Posso manipolare tabelle e intervalli in un PDF con Aspose.PDF?
Sì, Aspose.PDF consente di manipolare tabelle, intervalli e altri elementi strutturati all’interno di un documento PDF.
Dove posso scaricare Aspose.PDF per .NET?
Puoi scaricare l’ultima versione di Aspose.PDF per .NETQui.