Word 문서에서 콘텐츠 추출 및 수정

Python을 위한 Aspose.Words 소개

Aspose.Words는 Word 문서를 프로그래밍 방식으로 작업하기 위한 광범위한 기능을 제공하는 인기 있는 문서 조작 및 생성 라이브러리입니다. Python API는 Word 문서 내의 콘텐츠를 추출, 수정 및 조작하는 광범위한 기능을 제공합니다.

설치 및 설정

시작하려면 시스템에 Python이 설치되어 있는지 확인하세요. 그런 다음 다음 명령을 사용하여 Aspose.Words for Python 라이브러리를 설치할 수 있습니다.

pip install aspose-words

Word 문서 로딩

Word 문서를 로드하는 것은 해당 문서의 내용을 다루는 첫 번째 단계입니다. 다음 코드 조각을 사용하여 문서를 로드할 수 있습니다.

from asposewords import Document

doc = Document("path/to/your/document.docx")

텍스트 추출

문서에서 텍스트를 추출하려면 문단과 실행을 반복할 수 있습니다.

for para in doc.get_child_nodes(asposewords.NodeType.PARAGRAPH, True):
    text = para.get_text()
    print(text)

텍스트 수정

런이나 문단의 텍스트를 직접 설정하여 텍스트를 수정할 수 있습니다.

for para in doc.get_child_nodes(asposewords.NodeType.PARAGRAPH, True):
    if "old_text" in para.get_text():
        para.get_runs().get(0).set_text("new_text")

서식 작업

Aspose.Words를 사용하면 다음과 같은 서식 스타일로 작업할 수 있습니다.

run = doc.get_first_section().get_body().get_first_paragraph().get_runs().get(0)
run.get_font().set_bold(True)
run.get_font().set_color(255, 0, 0)

텍스트 바꾸기

텍스트를 바꾸는 것은 다음을 사용하여 수행할 수 있습니다.replace 방법:

doc.get_range().replace("old_text", "new_text", False, False)

이미지 추가 및 수정

이미지는 다음을 사용하여 추가하거나 교체할 수 있습니다.insert_image 방법:

shape = doc.get_first_section().get_body().append_child(asposewords.Drawing.Shape(doc, asposewords.Drawing.ShapeType.IMAGE))
shape.get_image_data().set_source("path/to/image.jpg")

수정된 문서 저장

수정 후 문서를 저장합니다.

doc.save("path/to/modified/document.docx")

테이블과 목록 처리

테이블과 목록을 사용하면 행과 셀을 반복하는 작업이 포함됩니다.

for table in doc.get_child_nodes(asposewords.NodeType.TABLE, True):
    for row in table.get_rows():
        for cell in row.get_cells():
            text = cell.get_text()

헤더와 푸터 처리

헤더와 푸터에 접근하여 수정할 수 있습니다.

header = doc.get_first_section().get_headers_footers().get_by_header_footer_type(asposewords.HeaderFooterType.HEADER_PRIMARY)
header.get_paragraphs().add("Header content")

하이퍼링크 추가

하이퍼링크는 다음을 사용하여 추가할 수 있습니다.insert_hyperlink 방법:

run = doc.get_first_section().get_body().get_first_paragraph().get_runs().get(0)
run.get_font().set_color(0, 0, 255)
doc.get_hyperlinks().add(run, "https://"www.example.com")

다른 형식으로 변환

Aspose.Words는 다양한 형식으로 문서를 변환하는 것을 지원합니다.

doc.save("path/to/converted/document.pdf", asposewords.SaveFormat.PDF)

고급 기능 및 자동화

Aspose.Words는 메일 병합, 문서 비교 등과 같은 고급 기능을 제공합니다. 복잡한 작업을 쉽게 자동화하세요.

결론

Aspose.Words for Python은 Word 문서를 손쉽게 조작하고 수정할 수 있는 다재다능한 라이브러리입니다. 텍스트를 추출하거나, 콘텐츠를 바꾸거나, 문서를 포맷해야 할 때 이 API는 필요한 도구를 제공합니다.

자주 묻는 질문

Python에 Aspose.Words를 어떻게 설치하나요?

Python용 Aspose.Words를 설치하려면 다음 명령을 사용하세요.pip install aspose-words.

이 라이브러리를 사용하여 텍스트 서식을 수정할 수 있나요?

네, Aspose.Words for Python API를 사용하여 굵게, 색상, 글꼴 크기 등의 텍스트 서식을 수정할 수 있습니다.

문서 내의 특정 텍스트를 바꿀 수 있나요?

물론, 당신은 사용할 수 있습니다replace 문서 내의 특정 텍스트를 바꾸는 방법입니다.

Word 문서에 하이퍼링크를 추가할 수 있나요?

물론입니다. 다음을 사용하여 문서에 하이퍼링크를 추가할 수 있습니다.insert_hyperlink Aspose.Words가 제공하는 방법입니다.

Word 문서를 어떤 다른 형식으로 변환할 수 있나요?

Aspose.Words는 PDF, HTML, EPUB 등 다양한 형식으로의 변환을 지원합니다.