PDF Dosyasında Normal İfadeyi Ara
Bu eğitimde, PDF dosyasındaki normal ifadeyle eşleşen metni aramak ve almak için Aspose.PDF for .NET’in nasıl kullanılacağı açıklanmaktadır. Sağlanan C# kaynak kodu süreci adım adım gösterir.
Önkoşullar
Eğiticiye devam etmeden önce aşağıdakilere sahip olduğunuzdan emin olun:
- Temel C# programlama dili bilgisi.
- Aspose.PDF for .NET kütüphanesi kuruldu. Bunu Aspose web sitesinden edinebilir veya projenize kurmak için NuGet’i kullanabilirsiniz.
1. Adım: Projeyi ayarlayın
Tercih ettiğiniz entegre geliştirme ortamında (IDE) yeni bir C# projesi oluşturarak başlayın ve Aspose.PDF for .NET kitaplığına bir referans ekleyin.
2. Adım: Gerekli ad alanlarını içe aktarın
Gerekli ad alanlarını içe aktarmak için C# dosyanızın başına aşağıdaki kullanma yönergelerini ekleyin:
using Aspose.Pdf;
using Aspose.Pdf.Text;
3. Adım: PDF belgesini yükleyin
PDF belge dizininizin yolunu ayarlayın ve belgeyi kullanarak yükleyin.Document
sınıf:
string dataDir = "YOUR DOCUMENT DIRECTORY";
Document pdfDocument = new Document(dataDir + "SearchRegularExpressionAll.pdf");
Değiştirdiğinizden emin olun"YOUR DOCUMENT DIRECTORY"
belge dizininizin gerçek yolu ile.
4. Adım: Normal ifadeyle arama yapın
OluşturmakTextFragmentAbsorber
nesnesini açın ve kalıpla eşleşen tüm ifadeleri bulmak için normal ifade modelini ayarlayın:
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("\\d{4}-\\d{4}"); // 1999-2000 gibi
Yer değiştirmek"\\d{4}-\\d{4}"
İstediğiniz düzenli ifade modeliyle.
5. Adım: Metin arama seçeneklerini ayarlayın
OluşturmakTextSearchOptions
nesneyi seçin ve buna ayarlayınTextSearchOptions
mülkiyetiTextFragmentAbsorber
Düzenli ifade kullanımını etkinleştirmek için nesne:
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textFragmentAbsorber.TextSearchOptions = textSearchOptions;
6. Adım: Tüm sayfalarda arama yapın
Belgenin tüm sayfaları için emiciyi kabul edin:
pdfDocument.Pages.Accept(textFragmentAbsorber);
7. Adım: Çıkarılan metin parçalarını alın
Çıkarılan metin parçalarını kullanarak alınTextFragments
mülkiyetiTextFragmentAbsorber
nesne:
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;
Adım 8: Metin parçaları arasında döngü yapın
Alınan metin parçaları arasında dolaşın ve özelliklerine erişin:
foreach (TextFragment textFragment in textFragmentCollection)
{
Console.WriteLine("Text: {0} ", textFragment.Text);
Console.WriteLine("Position: {0} ", textFragment.Position);
Console.WriteLine("XIndent: {0} ", textFragment.Position.XIndent);
Console.WriteLine("YIndent: {0} ", textFragment.Position.YIndent);
Console.WriteLine("Font - Name: {0}", textFragment.TextState.Font.FontName);
Console.WriteLine("Font - IsAccessible: {0} ", textFragment.TextState.Font.IsAccessible);
Console.WriteLine("Font - IsEmbedded: {0} ", textFragment.TextState.Font.IsEmbedded);
Console.WriteLine("Font - IsSubset: {0} ", textFragment.TextState.Font.IsSubset);
Console.WriteLine("Font Size: {0} ", textFragment.TextState.FontSize);
Console.WriteLine("Foreground Color: {0} ", textFragment.TextState.ForegroundColor);
}
Her metin parçası üzerinde daha fazla eylem gerçekleştirmek için döngü içindeki kodu değiştirebilirsiniz.
Aspose.PDF for .NET kullanarak Normal İfade Arama için örnek kaynak kodu
// Belgeler dizininin yolu.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Belgeyi aç
Document pdfDocument = new Document(dataDir + "SearchRegularExpressionAll.pdf");
// Normal ifadeyle eşleşen tüm ifadeleri bulmak için TextAbsorber nesnesi oluşturun
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("\\d{4}-\\d{4}"); // 1999-2000 gibi
// Normal ifade kullanımını belirtmek için metin arama seçeneğini ayarlayın
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textFragmentAbsorber.TextSearchOptions = textSearchOptions;
// Tüm sayfalar için emiciyi kabul edin
pdfDocument.Pages.Accept(textFragmentAbsorber);
// Çıkarılan metin parçalarını alın
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;
// Parçalar arasında döngü yapın
foreach (TextFragment textFragment in textFragmentCollection)
{
Console.WriteLine("Text : {0} ", textFragment.Text);
Console.WriteLine("Position : {0} ", textFragment.Position);
Console.WriteLine("XIndent : {0} ", textFragment.Position.XIndent);
Console.WriteLine("YIndent : {0} ", textFragment.Position.YIndent);
Console.WriteLine("Font - Name : {0}", textFragment.TextState.Font.FontName);
Console.WriteLine("Font - IsAccessible : {0} ", textFragment.TextState.Font.IsAccessible);
Console.WriteLine("Font - IsEmbedded : {0} ", textFragment.TextState.Font.IsEmbedded);
Console.WriteLine("Font - IsSubset : {0} ", textFragment.TextState.Font.IsSubset);
Console.WriteLine("Font Size : {0} ", textFragment.TextState.FontSize);
Console.WriteLine("Foreground Color : {0} ", textFragment.TextState.ForegroundColor);
}
Çözüm
Tebrikler! Aspose.PDF for .NET’i kullanarak bir PDF belgesinde normal ifadeyle eşleşen metni nasıl arayacağınızı ve alacağınızı başarıyla öğrendiniz. Bu eğitimde, belgenin yüklenmesinden çıkarılan metin parçalarına erişmeye kadar adım adım bir kılavuz sağlanmıştır. Artık PDF dosyalarında gelişmiş metin aramaları gerçekleştirmek için bu kodu kendi C# projelerinize dahil edebilirsiniz.
SSS’ler
S: “PDF Dosyasında Normal İfadeyi Ara” eğitiminin amacı nedir?
C: “PDF Dosyasında Normal İfadeyi Ara” eğitimi, bir PDF dosyasındaki belirli bir düzenli ifade düzeniyle eşleşen metni aramak ve çıkarmak için Aspose.PDF kütüphanesinin .NET için nasıl kullanılacağını göstermeyi amaçlamaktadır. Öğretici, süreci göstermek için kapsamlı rehberlik ve örnek C# kodu sağlar.
S: Bu eğitim, bir PDF belgesinde normal ifadeler kullanılarak metin aranmasına nasıl yardımcı olur?
C: Bu eğitim, Aspose.PDF kütüphanesinin düzenli ifade düzenine dayalı olarak bir PDF belgesinde metin araması yapmak için kullanılmasına yönelik adım adım bir yaklaşım sağlar. Projenin nasıl kurulacağı, PDF belgesinin nasıl yükleneceği, düzenli ifade modelinin nasıl tanımlanacağı ve eşleşen metin parçalarının nasıl alınacağı ayrıntılarıyla anlatılmaktadır.
S: Bu eğitimi takip etmenin önkoşulları nelerdir?
C: Bu eğitime başlamadan önce C# programlama dili hakkında temel bilgiye sahip olmanız gerekir. Ayrıca Aspose.PDF for .NET kütüphanesinin de kurulu olması gerekir. Bunu Aspose web sitesinden edinebilir veya projenize entegre etmek için NuGet’i kullanabilirsiniz.
S: Projemi bu öğreticiyi takip edecek şekilde nasıl ayarlayabilirim?
C: Başlamak için tercih ettiğiniz entegre geliştirme ortamında (IDE) yeni bir C# projesi oluşturun ve Aspose.PDF for .NET kütüphanesine bir referans ekleyin. Bu, projeniz dahilinde kütüphanenin yeteneklerinden yararlanmanıza olanak sağlayacaktır.
S: Bir PDF belgesinde metin aramak için normal ifadeleri kullanabilir miyim?
C: Evet, bu eğitimde bir PDF belgesinde metin aramak ve çıkarmak için normal ifadelerin nasıl kullanılacağı gösterilmektedir. Şunların kullanılmasını içerir:TextFragmentAbsorber
sınıfını kullanarak ve sağlanan kalıpla eşleşen cümleleri bulmak için bir normal ifade modeli belirleyerek.
S: Metin araması için normal ifade modelini nasıl tanımlarım?
C: Metin aramaya yönelik bir normal ifade modeli tanımlamak içinTextFragmentAbsorber
kullanarak nesneyi seçin ve desenini ayarlayın.Text
parametre. Varsayılan deseni değiştir"\\d{4}-\\d{4}"
öğreticinin kodunda istediğiniz normal ifade düzeniyle.
S: Metin araması için normal ifade kullanımını nasıl etkinleştirebilirim?
C: Normal ifade kullanımı, birTextSearchOptions
nesne ve değerini ayarlamatrue
. Bu nesneyi şuraya atayın:TextSearchOptions
mülkiyetiTextFragmentAbsorber
misal. Bu, metin araması sırasında normal ifade modelinin uygulanmasını sağlar.
S: Normal ifade düzeniyle eşleşen metin parçalarını alabilir miyim?
C: Kesinlikle. PDF belgesinde normal ifade aramasını uyguladıktan sonra, çıkartılan metin parçalarınıTextFragments
mülkiyetiTextFragmentAbsorber
nesne. Bu metin parçaları, belirtilen düzenli ifade düzeniyle eşleşen metin parçalarını içerir.
S: Alınan metin parçalarından neye erişebilirim?
C: Alınan metin parçalarından eşleşen metin içeriği, konum (X ve Y koordinatları), yazı tipi bilgileri (ad, boyut, renk) ve daha fazlası gibi çeşitli özelliklere erişebilirsiniz. Öğreticinin döngüsündeki örnek kod, bu özelliklere nasıl erişileceğini ve görüntüleneceğini gösterir.
S: Çıkarılan metin parçaları üzerindeki eylemleri nasıl özelleştirebilirim?
C: Çıkarılan metin parçalarını aldıktan sonra, her metin parçası üzerinde ek eylemler gerçekleştirmek için döngü içindeki kodu özelleştirebilirsiniz. Bu, çıkarılan metnin kaydedilmesini, kalıpların analiz edilmesini veya gereksinimlerinize göre biçimlendirme değişikliklerinin uygulanmasını içerebilir.