टेक्स्ट खोजें और आयत बनाएं

परिचय

क्या आप अपने PDF हेरफेर कौशल को बढ़ाना चाहते हैं? क्या आप सीखना चाहते हैं कि PDF फ़ाइलों में विशिष्ट टेक्स्ट कैसे खोजें और इसे आयत के साथ हाइलाइट करें? आप सही गाइड पर पहुँच गए हैं! आज, मैं आपको .NET के लिए Aspose.PDF का उपयोग करके PDF दस्तावेज़ में टेक्स्ट खोजने और उसके चारों ओर आयत बनाने का तरीका बताऊंगा। यह लेख स्पष्टता और उपयोगिता को ध्यान में रखते हुए डिज़ाइन किया गया एक चरण-दर-चरण ट्यूटोरियल प्रदान करेगा, यह सुनिश्चित करते हुए कि आप इन तकनीकों का पालन कर सकते हैं और अपनी परियोजनाओं पर लागू कर सकते हैं।

आवश्यक शर्तें

ट्यूटोरियल में आगे बढ़ने से पहले, आइए तैयारी करें कि सुचारू कार्यप्रवाह सुनिश्चित करने के लिए आपको क्या करना होगा:

  1. .NET की बुनियादी समझ: इस ट्यूटोरियल को प्रभावी ढंग से समझने के लिए आपको C# प्रोग्रामिंग और .NET फ्रेमवर्क से परिचित होना चाहिए।

  2. विज़ुअल स्टूडियो इंस्टॉल: आपको अपना कोड लिखने और उसका परीक्षण करने के लिए एक एकीकृत विकास वातावरण (IDE) की आवश्यकता होगी। विज़ुअल स्टूडियो समुदाय एक बढ़िया विकल्प है, और यह मुफ़्त है।

  3. .NET के लिए Aspose.PDF: आपको अपने प्रोजेक्ट में Aspose.PDF लाइब्रेरी इंस्टॉल करनी होगी। आप इसे डाउनलोड कर सकते हैंयहाँ या विचार करेंअस्थायी लाइसेंस विस्तारित सुविधाओं के लिए.

  4. नमूना पीडीएफ दस्तावेज़: इस ट्यूटोरियल के लिए, आपको एक नमूना पीडीएफ फाइल की आवश्यकता होगी जिसका नाम हैSearchAndGetTextFromAll.pdf आपके प्रोजेक्ट निर्देशिका में संग्रहीत.

पैकेज आयात करें

आरंभ करने के लिए, आपको सबसे पहले अपने .NET प्रोजेक्ट में आवश्यक पैकेज आयात करने होंगे। इन चरणों का पालन करें:

विज़ुअल स्टूडियो खोलें

विजुअल स्टूडियो लॉन्च करें और एक नया कंसोल एप्लिकेशन बनाएं या किसी मौजूदा एप्लिकेशन का उपयोग करें जहां आप पीडीएफ कार्यात्मकताएं लागू करना चाहते हैं।

अपने प्रोजेक्ट में Aspose.PDF जोड़ें

  1. समाधान एक्सप्लोरर में अपने प्रोजेक्ट पर राइट-क्लिक करें।
  2. “NuGet पैकेज प्रबंधित करें” चुनें.
  3. निम्न को खोजेंAspose.PDF और नवीनतम संस्करण स्थापित करें.

ऐसा करके, आप उन सभी अद्भुत पीडीएफ हेरफेरों के लिए आधार तैयार कर रहे हैं जो आप करने वाले हैं।

नामस्थान आयात करें

अपनी प्रोग्राम फ़ाइल के शीर्ष पर, आप Aspose लाइब्रेरी से प्रासंगिक नामस्थानों को आयात करना चाहेंगे:

using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
using System;
using Aspose.Pdf.Facades;

इससे आपके कार्यों के लिए Aspose.PDF लाइब्रेरी के भीतर कक्षाओं और विधियों तक पहुंचना आसान हो जाता है।

अब जब आपने सब कुछ सेट कर लिया है तो आइए पीडीएफ में पाठ खोजने और उसके चारों ओर एक आयत बनाने की प्रक्रिया को प्रबंधनीय चरणों में विभाजित करें।

चरण 1: अपने दस्तावेज़ के लिए पथ सेट करें

सबसे पहले, अपनी PDF फ़ाइल का पथ सेट करें।YOUR DOCUMENT DIRECTORY वास्तविक पथ के साथ जहाँ आपकाSearchAndGetTextFromAll.pdf संग्रहीत है.

string dataDir = "YOUR DOCUMENT DIRECTORY";

चरण 2: पीडीएफ दस्तावेज़ खोलें

इसके बाद, इसका एक उदाहरण बनाएंDocument अपना पीडीएफ लोड करने के लिए क्लास:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

कोड की यह पंक्ति आपकी निर्दिष्ट पीडीएफ फाइल को खोलती है, जिससे आप उसमें और अधिक परिवर्तन कर सकते हैं।

चरण 3: टेक्स्ट अवशोषक बनाएँ

अब, आपको उस दस्तावेज़ में टेक्स्ट खोजने का कोई तरीका चाहिए होगा। इसके लिए, हम इसका उपयोग करते हैंTextFragmentAbsorber:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

नियमित अभिव्यक्ति@"[\S]+" पीडीएफ में किसी भी गैर-रिक्त स्थान स्ट्रिंग से मिलान करने के लिए डिज़ाइन किया गया है।

चरण 4: टेक्स्ट खोज विकल्प कॉन्फ़िगर करें

इसके बाद, आपको पाठ खोज विकल्प सेट करना चाहिए:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

यहाँ,true पैरामीटर का मतलब है कि खोज केस-सेंसिटिव होगी। आप इसे इस प्रकार सेट कर सकते हैंfalse यदि आप केस-असंवेदनशील खोज चाहते हैं।

चरण 5: दस्तावेज़ में टेक्स्ट अवशोषक को स्वीकार करें

आपके साथTextFragmentAbsorber और खोज विकल्प तैयार होने के बाद, दस्तावेज़ से पाठ को अवशोषित करने का समय आ गया है:

document.Pages.Accept(textAbsorber);

यह विधि आपके पीडीएफ में प्रत्येक पृष्ठ की जांच करके निर्दिष्ट पैटर्न से मेल खाने वाले पाठ अंश ढूंढती है।

चरण 6: एक PdfContentEditor बनाएं

दस्तावेज़ पर आकृतियाँ बनाने के लिए, आपको इसकी आवश्यकता होगीPdfContentEditor:

var editor = new PdfContentEditor(document);

यह संपादक आपको पीडीएफ सामग्री को आसानी से संशोधित और संपादित करने की अनुमति देता है।

चरण 7: पाए गए पाठ अंशों के माध्यम से लूप करें

अब, आप पाए गए पाठ अंशों के माध्यम से लूप बनाना चाहेंगे ताकि उनके चारों ओर आयताकार आकृतियाँ बनाई जा सकें:

foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

यह लूप प्रत्येक पाठ खंड और उनके खंडों पर पुनरावृत्ति करता है, और कॉल करता हैDrawBox आयत चित्रांकन की विधि.

चरण 8: ड्राबॉक्स विधि को परिभाषित करें

आपको परिभाषित करने की आवश्यकता हैDrawBox विधि, जो आयत आरेखण तर्क को संभालेगी। यहाँ एक सरल कार्यान्वयन है:

private static void DrawBox(PdfContentEditor editor, int pageNumber, TextSegment textSegment, System.Drawing.Color color)
{
    // पाठ खंड के आधार पर आयत के आयामों की गणना करें
    float x = textSegment.Rectangle.LLX;
    float y = textSegment.Rectangle.LLY;
    float width = textSegment.Rectangle.Width;
    float height = textSegment.Rectangle.Height;

    // गणना किए गए मानों का उपयोग करके एक आयत बनाएं
    editor.DrawRectangle(pageNumber, x, y, width, height, color, 1);
}

यह विधि खंड की सीमाबद्ध आयत के आधार पर आयत की स्थिति और आकार निर्धारित करती है तथा उसे आरेखित करने के लिए संपादक का उपयोग करती है।

चरण 9: संशोधित दस्तावेज़ सहेजें

पाए गए पाठ के चारों ओर आयत बनाने के बाद, आप संशोधित दस्तावेज़ को सहेज सकते हैं:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

सुनिश्चित करें कि आपकी नई फ़ाइल एक अलग नाम से सहेजी गई है ताकि आपके मूल दस्तावेज़ को अधिलेखित होने से बचाया जा सके।

चरण 10: पुष्टिकरण संदेश

अंत में, कंसोल पर एक पुष्टिकरण संदेश प्रिंट करें ताकि आपको पता चल सके कि ऑपरेशन सफल रहा:

Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

और बस, अब आपने PDF में टेक्स्ट खोजने और उसे आयतों से हाइलाइट करने के लिए सफलतापूर्वक एक स्क्रिप्ट बना ली है।

निष्कर्ष

बधाई हो! आपने अभी-अभी एक शक्तिशाली कौशल अनलॉक किया है जो .NET के लिए Aspose.PDF का उपयोग करके आपकी PDF हेरफेर क्षमताओं को बहुत बढ़ा सकता है। बस कुछ सरल चरणों के साथ, आप अपने दस्तावेज़ में किसी भी पाठ को खोज सकते हैं और इसे नेत्रहीन रूप से हाइलाइट कर सकते हैं, जिससे आपके PDF दस्तावेज़ अधिक इंटरैक्टिव और प्रबंधनीय बन जाते हैं। इस टूल को वास्तव में अपना बनाने के लिए विभिन्न रेगेक्स पैटर्न और रंग विकल्पों के साथ प्रयोग करने में संकोच न करें!

अक्सर पूछे जाने वाले प्रश्न

.NET के लिए Aspose.PDF क्या है?

.NET के लिए Aspose.PDF एक लाइब्रेरी है जो प्रोग्रामेटिक रूप से PDF दस्तावेज़ों को बनाने, हेरफेर करने और परिवर्तित करने का एक व्यापक तरीका प्रदान करती है।

क्या मैं Aspose.PDF का निःशुल्क उपयोग कर सकता हूँ?

हां, Aspose एक निःशुल्क परीक्षण प्रदान करता है जिसका उपयोग आप लाइब्रेरी की कार्यक्षमताओं का परीक्षण करने के लिए कर सकते हैं। इसे देखेंयहाँ.

.NET के लिए Aspose.PDF के साथ मुझे किस प्रोग्रामिंग भाषा का उपयोग करना होगा?

.NET के लिए Aspose.PDF को C# और अन्य .NET भाषाओं के साथ उपयोग करने के लिए डिज़ाइन किया गया है।

मैं Aspose.PDF के संबंध में सहायता कैसे प्राप्त कर सकता हूँ?

आप किसी भी समस्या या प्रश्न के संबंध में सहायता के लिए Aspose सहायता फ़ोरम पर जा सकते हैं। सहायता पाएँयहाँ.

मैं .NET के लिए Aspose.PDF कहां से डाउनलोड करूं?

आप लाइब्रेरी को Aspose वेबसाइट से डाउनलोड कर सकते हैं,यहाँ.