要使用Python批量提取Word中的指定內容,你可以使用Python-docx庫來處理Word文檔。下面是一個示例代碼,可以幫助你提取Word文檔中的指定內容:
from docx import Document
def extract_content_from_word(file_path, target_text):
doc = Document(file_path)
extracted_content = []
for paragraph in doc.paragraphs:
if target_text in paragraph.text:
extracted_content.append(paragraph.text)
return extracted_content
# 調用示例
file_path = 'path_to_your_word_document.docx' # 替換為你的Word文檔路徑
target_text = '指定內容' # 替換為你要提取的指定內容
extracted_content = extract_content_from_word(file_path, target_text)
for content in extracted_content:
print(content)
這段代碼使用Python-docx庫打開指定路徑下的Word文檔,并遍歷文檔的每個段落。如果段落中包含目標文本,就將該段落內容添加到extracted_content
列表中。最后,打印提取到的內容。
請替換file_path
變量為你的Word文檔的實際路徑,將target_text
變量替換為你要提取的指定內容。