ค้นหาข้อความและวาดรูปสี่เหลี่ยมผืนผ้า

บทช่วยสอนนี้จะอธิบายวิธีใช้ Aspose.PDF สำหรับ .NET เพื่อค้นหาข้อความเฉพาะในเอกสาร PDF วาดรูปสี่เหลี่ยมผืนผ้ารอบข้อความที่พบ และบันทึกเอกสารที่แก้ไข ซอร์สโค้ด C# ที่ให้มาสาธิตกระบวนการทีละขั้นตอน

ข้อกำหนดเบื้องต้น

ก่อนที่จะดำเนินการบทแนะนำต่อ โปรดแน่ใจว่าคุณมีสิ่งต่อไปนี้:

  • ความรู้พื้นฐานเกี่ยวกับภาษาการเขียนโปรแกรม C#
  • ติดตั้ง Aspose.PDF สำหรับไลบรารี .NET แล้ว คุณสามารถรับได้จากเว็บไซต์ Aspose หรือใช้ NuGet เพื่อติดตั้งในโครงการของคุณ

ขั้นตอนที่ 1: ตั้งค่าโครงการ

เริ่มต้นด้วยการสร้างโปรเจ็กต์ C# ใหม่ในสภาพแวดล้อมการพัฒนาแบบรวม (IDE) ที่คุณต้องการ และเพิ่มการอ้างอิงไปยังไลบรารี Aspose.PDF สำหรับ .NET

ขั้นตอนที่ 2: นำเข้าเนมสเปซที่จำเป็น

เพิ่มคำสั่งต่อไปนี้ที่จุดเริ่มต้นของไฟล์ C# ของคุณเพื่อนำเข้าเนมสเปซที่จำเป็น:

using Aspose.Pdf;
using Aspose.Pdf.Text;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;

ขั้นตอนที่ 3: กำหนดเส้นทางไปยังไดเร็กทอรีเอกสาร

กำหนดเส้นทางไปยังไดเร็กทอรีเอกสารของคุณโดยใช้ไฟล์dataDir ตัวแปร:

string dataDir = "YOUR DOCUMENT DIRECTORY";

แทนที่"YOUR DOCUMENT DIRECTORY" ด้วยเส้นทางจริงไปยังไดเร็กทอรีเอกสารของคุณ

ขั้นตอนที่ 4: โหลดเอกสาร PDF

โหลดเอกสาร PDF โดยใช้ไฟล์Document ระดับ:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

แทนที่"SearchAndGetTextFromAll.pdf" ด้วยชื่อจริงของไฟล์ PDF ของคุณ

ขั้นตอนที่ 5: สร้าง TextFragmentAbsorber

สร้างกTextFragmentAbsorber วัตถุเพื่อค้นหาทุกกรณีของวลีค้นหาอินพุต:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

แทนที่@"[\S]+" ด้วยรูปแบบนิพจน์ทั่วไปที่คุณต้องการ

ขั้นตอนที่ 6: เปิดใช้งานการค้นหานิพจน์ทั่วไป

เปิดใช้งานการค้นหานิพจน์ทั่วไปโดยการตั้งค่าTextSearchOptions คุณสมบัติตัวดูดซับ:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

ขั้นตอนที่ 7: ค้นหาในทุกหน้า

ยอมรับตัวดูดซับสำหรับทุกหน้าของเอกสาร:

document.Pages.Accept(textAbsorber);

ขั้นตอนที่ 8: วาดรูปสี่เหลี่ยมผืนผ้ารอบข้อความที่พบ

สร้างกPdfContentEditor วัตถุและวนซ้ำส่วนข้อความที่ดึงมา วาดรูปสี่เหลี่ยมผืนผ้ารอบแต่ละส่วนของข้อความ:

var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

ขั้นตอนที่ 9: บันทึกเอกสารที่แก้ไข

บันทึกเอกสารที่แก้ไข:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

ตรวจสอบให้แน่ใจว่าได้เปลี่ยน"SearchTextAndDrawRectangle_out.pdf" ด้วยชื่อไฟล์เอาต์พุตที่ต้องการ

ตัวอย่างซอร์สโค้ดสำหรับค้นหาข้อความและวาดรูปสี่เหลี่ยมผืนผ้าโดยใช้ Aspose.PDF สำหรับ .NET

// เส้นทางไปยังไดเร็กทอรีเอกสาร
string dataDir = "YOUR DOCUMENT DIRECTORY";
// เปิดเอกสาร
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
// สร้างวัตถุ TextAbsorber เพื่อค้นหาวลีทั้งหมดที่ตรงกับนิพจน์ทั่วไป
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
document.Pages.Accept(textAbsorber); 
var editor = new PdfContentEditor(document); 
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
			DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
	}
}
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

บทสรุป

ยินดีด้วย! คุณได้เรียนรู้วิธีค้นหาข้อความที่ต้องการในเอกสาร PDF, วาดรูปสี่เหลี่ยมผืนผ้ารอบๆ ข้อความที่พบ และบันทึกเอกสารที่แก้ไขโดยใช้ Aspose.PDF สำหรับ .NET เรียบร้อยแล้ว บทช่วยสอนนี้ให้คำแนะนำทีละขั้นตอน ตั้งแต่การตั้งค่าโปรเจ็กต์ไปจนถึงการดำเนินการที่จำเป็น ตอนนี้คุณสามารถรวมโค้ดนี้เข้ากับโปรเจ็กต์ C# ของคุณเองเพื่อจัดการข้อความและวาดรูปสี่เหลี่ยมในไฟล์ PDF

คำถามที่พบบ่อย

ถาม: จุดประสงค์ของบทช่วยสอน “ค้นหาข้อความและวาดรูปสี่เหลี่ยมผืนผ้า” คืออะไร

ตอบ: บทช่วยสอน “ค้นหาข้อความและวาดรูปสี่เหลี่ยมผืนผ้า” มีวัตถุประสงค์เพื่อแนะนำผู้ใช้ตลอดกระบวนการใช้ไลบรารี Aspose.PDF สำหรับ .NET เพื่อค้นหาข้อความเฉพาะภายในเอกสาร PDF วาดรูปสี่เหลี่ยมรอบๆ ส่วนข้อความที่พบ และบันทึกข้อความที่แก้ไข เอกสาร. บทช่วยสอนให้คำแนะนำโดยละเอียดและตัวอย่างโค้ด C# เพื่อแสดงแต่ละขั้นตอนของกระบวนการ

ถาม: บทช่วยสอนนี้ช่วยในการวาดรูปสี่เหลี่ยมรอบข้อความเฉพาะในเอกสาร PDF อย่างไร

ตอบ: บทช่วยสอนนี้ให้คำแนะนำที่ครอบคลุมเกี่ยวกับวิธีค้นหาและวาดรูปสี่เหลี่ยมรอบๆ ส่วนข้อความเฉพาะภายในเอกสาร PDF โดยสาธิตกระบวนการตั้งค่าโปรเจ็กต์ การโหลดเอกสาร PDF การเปิดใช้งานการค้นหานิพจน์ทั่วไป การวาดรูปสี่เหลี่ยมรอบๆ ส่วนข้อความที่พบ และการบันทึก PDF ที่แก้ไข

ถาม: ข้อกำหนดเบื้องต้นใดบ้างที่จำเป็นในการปฏิบัติตามบทช่วยสอนนี้

ตอบ: ก่อนที่จะเริ่มบทช่วยสอน คุณควรมีความเข้าใจพื้นฐานเกี่ยวกับภาษาการเขียนโปรแกรม C# นอกจากนี้ คุณต้องติดตั้งไลบรารี Aspose.PDF สำหรับ .NET ด้วย คุณสามารถรับได้จากเว็บไซต์ Aspose หรือติดตั้งในโครงการของคุณโดยใช้ NuGet

ถาม: ฉันจะตั้งค่าโปรเจ็กต์ให้ปฏิบัติตามบทช่วยสอนนี้ได้อย่างไร

ตอบ: เริ่มต้นด้วยการสร้างโปรเจ็กต์ C# ใหม่ในสภาพแวดล้อมการพัฒนาแบบรวม (IDE) ที่คุณต้องการ จากนั้น เพิ่มการอ้างอิงไปยังไลบรารี Aspose.PDF สำหรับ .NET ให้กับโปรเจ็กต์ของคุณ ซึ่งจะทำให้คุณสามารถใช้ฟังก์ชันการทำงานของไลบรารีเพื่อจัดการเอกสาร PDF ได้

ถาม: ฉันสามารถวาดรูปสี่เหลี่ยมรอบข้อความที่ต้องการโดยใช้บทช่วยสอนนี้ได้หรือไม่

ตอบ: ใช่ บทช่วยสอนนี้เน้นที่การวาดสี่เหลี่ยมรอบๆ ส่วนข้อความเฉพาะภายในเอกสาร PDF โดยจะสาธิตวิธีการค้นหาข้อความที่ต้องการโดยใช้นิพจน์ทั่วไป สร้างสี่เหลี่ยมรอบส่วนของข้อความที่ระบุ และบันทึก PDF ที่แก้ไขแล้ว

ถาม: ฉันจะระบุข้อความที่ต้องการค้นหาและวาดรูปสี่เหลี่ยมรอบๆ ได้อย่างไร

ตอบ: หากต้องการระบุข้อความที่คุณต้องการค้นหาและวาดรูปสี่เหลี่ยมรอบๆ ให้สร้างTextFragmentAbsorber วัตถุและกำหนดรูปแบบโดยใช้Text พารามิเตอร์. แทนที่รูปแบบเริ่มต้น@"[\S]+" ในโค้ดของบทช่วยสอนด้วยรูปแบบนิพจน์ทั่วไปที่คุณต้องการ

ถาม: ฉันจะเปิดใช้งานการค้นหาข้อความด้วยนิพจน์ทั่วไปได้อย่างไร

ตอบ: การค้นหานิพจน์ทั่วไปเปิดใช้งานได้โดยการสร้างTextSearchOptions วัตถุและตั้งค่าเป็นtrue . กำหนดวัตถุนี้ให้กับTextSearchOptions ทรัพย์สินของTextFragmentAbsorber ตัวอย่าง. เพื่อให้แน่ใจว่ามีการใช้รูปแบบนิพจน์ทั่วไปในระหว่างการค้นหาข้อความ

ถาม: ฉันจะวาดรูปสี่เหลี่ยมรอบๆ ข้อความที่พบได้อย่างไร

ตอบ: หลังจากระบุส่วนของข้อความโดยใช้TextFragmentAbsorber บทช่วยสอนจะให้การวนซ้ำเพื่อวนซ้ำส่วนต่างๆ เหล่านี้ สำหรับแต่ละส่วนของข้อความ บทช่วยสอนจะสาธิตวิธีสร้างสี่เหลี่ยมรอบๆ ข้อความโดยใช้DrawBox วิธีการและระบุลักษณะของสี่เหลี่ยม

ถาม: ขั้นตอนในการบันทึก PDF ที่แก้ไขด้วยสี่เหลี่ยมที่วาดคืออะไร

ตอบ: หลังจากวาดรูปสี่เหลี่ยมรอบๆ ส่วนข้อความที่ต้องการแล้ว ให้ใช้Document ชั้นเรียนSave วิธีการบันทึกเอกสารที่แก้ไข โค้ดตัวอย่างของบทช่วยสอนจะแสดงวิธีบันทึก PDF ที่แก้ไขแล้วและแสดงข้อความแสดงความสำเร็จ

ถาม: ฉันสามารถปรับแต่งลักษณะของสี่เหลี่ยมที่วาดออกมาได้หรือไม่

ตอบ: ได้ คุณสามารถปรับแต่งลักษณะของสี่เหลี่ยมที่วาดได้ ในโค้ดตัวอย่างของบทช่วยสอนDrawBox วิธีการใช้ในการสร้างสี่เหลี่ยม คุณสามารถแก้ไขคุณสมบัติ เช่น สี สไตล์ และความหนา เพื่อปรับแต่งลักษณะของสี่เหลี่ยมที่วาดได้