HTML से कनवर्ट करने के बाद हाइपरलिंक हटाएँ

परिचय

डिजिटल युग में, HTML दस्तावेज़ों को PDF में बदलना एक आम काम है। हालाँकि, कभी-कभी आप विभिन्न कारणों से परिवर्तित PDF से हाइपरलिंक हटाना चाह सकते हैं, जैसे पठनीयता बढ़ाना या अवांछित नेविगेशन को रोकना। इस ट्यूटोरियल में, हम .NET के लिए Aspose.PDF का उपयोग करके इसे प्राप्त करने का तरीका जानेंगे।

आवश्यक शर्तें

कोड में आगे बढ़ने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित पूर्वापेक्षाएँ हैं:

  1. विज़ुअल स्टूडियो: सुनिश्चित करें कि आपके मशीन पर विज़ुअल स्टूडियो स्थापित है। यह आपका विकास वातावरण होगा।
  2. .NET के लिए Aspose.PDF: आपके पास Aspose.PDF लाइब्रेरी होनी चाहिए। आप इसे यहाँ से डाउनलोड कर सकते हैंयहाँ.
  3. C# का बुनियादी ज्ञान: C# प्रोग्रामिंग से परिचित होने से आपको कोड को बेहतर ढंग से समझने में मदद मिलेगी।

पैकेज आयात करें

आरंभ करने के लिए, आपको अपने C# प्रोजेक्ट में आवश्यक पैकेज आयात करने होंगे। आप यह कैसे कर सकते हैं, यहाँ बताया गया है:

  1. अपना विज़ुअल स्टूडियो प्रोजेक्ट खोलें.
  2. सॉल्यूशन एक्सप्लोरर में अपने प्रोजेक्ट पर राइट-क्लिक करें और “मैनेज नुगेट पैकेजेस” चुनें।
  3. निम्न को खोजेंAspose.PDF और इसे स्थापित करें.
using Aspose.Pdf.Annotations;
using Aspose.Pdf.Text;
using System.IO;

अब जब आपने सब कुछ सेट कर लिया है, तो आइए HTML फ़ाइल को PDF में परिवर्तित करने के बाद उसमें से हाइपरलिंक्स हटाने की प्रक्रिया को समझते हैं।

चरण 1: दस्तावेज़ निर्देशिका सेट करें

सबसे पहले, आपको अपने दस्तावेज़ निर्देशिका का पथ निर्दिष्ट करना होगा। यह वह जगह है जहाँ आपकी HTML फ़ाइल स्थित है और जहाँ आउटपुट PDF सहेजा जाएगा।

// दस्तावेज़ निर्देशिका का पथ.
string dataDir = "YOUR DOCUMENT DIRECTORY";

प्रतिस्थापित करें"YOUR DOCUMENT DIRECTORY" वास्तविक पथ के साथ जहां आपकी HTML फ़ाइल संग्रहीत है.

चरण 2: HTML दस्तावेज़ लोड करें

इसके बाद, आप HTML दस्तावेज़ को लोड करेंगेDocument Aspose.PDF से क्लास। यह क्लास आपको PDF दस्तावेज़ों के साथ आसानी से काम करने की अनुमति देता है।

Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());

यहाँ, हम नाम की HTML फ़ाइल लोड कर रहे हैंSampleHtmlFile.htmlसुनिश्चित करें कि यह फ़ाइल आपकी निर्दिष्ट निर्देशिका में मौजूद है।

चरण 3: दस्तावेज़ को मेमोरी स्ट्रीम में सहेजें

एनोटेशन को प्रोसेस करने से पहले, हमें डॉक्यूमेंट को मेमोरी स्ट्रीम में सेव करना होगा। यह कदम महत्वपूर्ण है क्योंकि यह डॉक्यूमेंट को आगे के हेरफेर के लिए तैयार करता है।

doc.Save(new MemoryStream());

यह पंक्ति दस्तावेज़ को मेमोरी में सहेज लेती है, जिससे हम उसे डिस्क पर लिखे बिना भी उस पर काम कर सकते हैं।

चरण 4: एनोटेशन के माध्यम से पुनरावृत्ति करें

अब, हम दस्तावेज़ में एनोटेशन के माध्यम से पुनरावृत्ति करेंगे। एनोटेशन लिंक, टिप्पणियाँ और हाइलाइट जैसे तत्व हैं। हम विशेष रूप से लिंक एनोटेशन में रुचि रखते हैं।

foreach (Annotation a in doc.Pages[1].Annotations)
{
    if (a.AnnotationType == AnnotationType.Link)
    {
        // लिंक एनोटेशन को संसाधित करें
    }
}

इस लूप में, हम जाँचते हैं कि क्या एनोटेशन का प्रकार लिंक है। यदि ऐसा है, तो हम अगले चरणों पर आगे बढ़ते हैं।

चरण 5: हाइपरलिंक क्रिया हटाएँ

प्रत्येक लिंक एनोटेशन के लिए, हमें यह जांचना होगा कि क्या इसमें हाइपरलिंक क्रिया है। यदि ऐसा है, तो हम इसके URI को खाली स्ट्रिंग पर सेट करके हाइपरलिंक को हटा देंगे।

LinkAnnotation la = (LinkAnnotation)a;
if (la.Action is GoToURIAction)
{
    GoToURIAction gta = (GoToURIAction)la.Action;
    gta.URI = "";

यह कोड स्निपेट सुनिश्चित करता है कि हाइपरलिंक क्रिया प्रभावी रूप से हटा दी गई है।

चरण 6: पाठ अंशों को अवशोषित करें

इसके बाद, हम लिंक एनोटेशन से जुड़े टेक्स्ट अंशों को अवशोषित करेंगे। इससे हमें टेक्स्ट की बनावट में बदलाव करने में मदद मिलेगी।

TextFragmentAbsorber tfa = new TextFragmentAbsorber();
tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
doc.Pages[a.PageIndex].Accept(tfa);

यहाँ, हम एक बनाते हैंTextFragmentAbsorber और इसके खोज विकल्पों को एनोटेशन के आयत पर सेट करें। इससे हमें लिंक किए गए टेक्स्ट को खोजने में मदद मिलती है।

चरण 7: पाठ का स्वरूप संशोधित करें

एक बार जब हमारे पास टेक्स्ट के टुकड़े आ जाते हैं, तो हम उनके स्वरूप को संशोधित कर सकते हैं। इस मामले में, हम रेखांकन हटा देंगे और टेक्स्ट का रंग बदलकर काला कर देंगे।

foreach (TextFragment tf in tfa.TextFragments)
{
    tf.TextState.Underline = false;
    tf.TextState.ForegroundColor = Color.Black;
}

यह चरण हाइपरलिंक स्टाइलिंग को हटाकर पाठ की पठनीयता को बढ़ाता है।

चरण 8: एनोटेशन हटाएं

पाठ को संशोधित करने के बाद, हम दस्तावेज़ से लिंक एनोटेशन को सुरक्षित रूप से हटा सकते हैं।

doc.Pages[a.PageIndex].Annotations.Delete(a);
}

यह पंक्ति पीडीएफ से हाइपरलिंक को हटा देती है, जिससे यह सुनिश्चित हो जाता है कि अंतिम आउटपुट में यह मौजूद नहीं रहेगा।

चरण 9: संशोधित दस्तावेज़ सहेजें

अंत में, हमें संशोधित दस्तावेज़ को एक नई पीडीएफ फाइल में सहेजना होगा। यह हमारी प्रक्रिया का अंतिम चरण है।

doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

यह पंक्ति हाइपरलिंक्स को हटाकर दस्तावेज़ को सहेजती है, और नाम से एक नई पीडीएफ फाइल बनाती हैRemoveHyperlinksFromText_out.pdf.

निष्कर्ष

और अब यह हो गया! आपने Aspose.PDF for .NET का उपयोग करके HTML दस्तावेज़ को PDF में परिवर्तित करने के बाद उससे हाइपरलिंक्स को सफलतापूर्वक हटा दिया है। यह प्रक्रिया न केवल आपके PDF की पठनीयता को बढ़ाती है, बल्कि आपको आपके द्वारा प्रस्तुत की जाने वाली सामग्री पर नियंत्रण भी देती है।

अक्सर पूछे जाने वाले प्रश्न

क्या मैं किसी भी पीडीएफ दस्तावेज़ से हाइपरलिंक हटा सकता हूँ?

हां, आप .NET के लिए Aspose.PDF का उपयोग करके किसी भी PDF दस्तावेज़ से हाइपरलिंक हटा सकते हैं।

क्या Aspose.PDF का उपयोग निःशुल्क है?

Aspose.PDF निःशुल्क परीक्षण प्रदान करता है, लेकिन पूर्ण सुविधाओं के लिए, आपको लाइसेंस खरीदना होगा।खरीदें पेज.

यदि मुझे Aspose.PDF का उपयोग करते समय कोई समस्या आती है तो क्या होगा?

आप यहां पर सहायता ले सकते हैंसहयता मंच.

क्या मैं Aspose का उपयोग करके अन्य फ़ाइल स्वरूपों को PDF में परिवर्तित कर सकता हूँ?

हां, Aspose PDF में रूपांतरण के लिए विभिन्न फ़ाइल स्वरूपों का समर्थन करता है।

मैं .NET के लिए Aspose.PDF कहां से डाउनलोड कर सकता हूं?

आप इसे यहाँ से डाउनलोड कर सकते हैंलिंक को डाउनलोड करें.