在Python中,可以使用PyPDF2庫來讀取PDF文件中的文本。首先需要安裝PyPDF2庫,可以使用以下命令來安裝:
pip install PyPDF2
然后,可以使用以下代碼來讀取PDF文件中的文本:
import PyPDF2
# 打開PDF文件
pdf_file = open('example.pdf', 'rb')
# 創建PDF文件閱讀器對象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 獲取PDF文件中的頁面數
num_pages = pdf_reader.numPages
# 讀取每一頁的文本內容
for page_num in range(num_pages):
page = pdf_reader.getPage(page_num)
text = page.extract_text()
print(text)
# 關閉PDF文件
pdf_file.close()
以上代碼會打開名為example.pdf
的PDF文件,并逐頁讀取文本內容打印出來。當然,你也可以根據具體需求對文本內容進行處理或保存到文件中。