要使用Python3批量轉換DOCX文檔為TXT,可以使用python-docx庫來實現。下面是一個簡單的示例代碼:
from docx import Document
def convert_docx_to_txt(docx_file, txt_file):
doc = Document(docx_file)
with open(txt_file, 'w', encoding='utf-8') as f:
for paragraph in doc.paragraphs:
f.write(paragraph.text + '\n')
# 批量轉換
docx_files = ['file1.docx', 'file2.docx', 'file3.docx']
for docx_file in docx_files:
# 構建輸出文件名
txt_file = docx_file.replace('.docx', '.txt')
convert_docx_to_txt(docx_file, txt_file)
上述代碼中,convert_docx_to_txt
函數接受一個DOCX文件路徑和一個TXT文件路徑作為輸入,將DOCX文檔的內容逐行寫入TXT文件中。然后,使用docx_files
列表存儲需要轉換的DOCX文件名,循環遍歷列表中的每個文件,調用convert_docx_to_txt
函數進行轉換。
請注意,代碼中使用的是python-docx庫,因此您需要先安裝該庫。您可以使用以下命令來進行安裝:
pip install python-docx
請確保您已經安裝了Python 3和pip,并且將DOCX文件放置在與代碼文件相同的目錄中。