中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

PaddleOCR如何對大量圖片進行批量文本識別

小億
252
2024-04-07 17:27:37
欄目: 編程語言

PaddleOCR可以通過編寫簡單的Python腳本來實現對大量圖片進行批量文本識別。以下是一個示例代碼,演示如何使用PaddleOCR對指定目錄下的所有圖片進行批量文本識別:

import os
from paddleocr import PaddleOCR, draw_ocr

ocr = PaddleOCR()

# 指定需要識別文本的圖片目錄
img_dir = 'path/to/your/image/directory'

# 獲取目錄下所有圖片文件名
img_files = [f for f in os.listdir(img_dir) if f.endswith('.jpg') or f.endswith('.png')]

for img_file in img_files:
    img_path = os.path.join(img_dir, img_file)
    result = ocr.ocr(img_path, cls=True)

    for line in result:
        print('Detected text:', ''.join([word[0] for word in line[1]]))
        print('Confidence:', line[1][0][-1])
        
    # 可以根據需要將識別結果保存到文件中
    output_file = 'path/to/save/{}.txt'.format(os.path.splitext(img_file)[0])
    with open(output_file, 'w', encoding='utf-8') as f:
        for line in result:
            f.write(''.join([word[0] for word in line[1]]) + '\n')

在上面的示例代碼中,首先導入PaddleOCR模塊,然后實例化一個PaddleOCR對象。接著指定需要識別文本的圖片目錄,獲取該目錄下所有圖片文件名,并遍歷每個圖片文件進行文本識別。最后,將識別結果打印出來,并可選擇保存到文件中。

通過這種方式,您可以輕松地對大量圖片進行批量文本識別,并將結果保存到文件中,以供后續分析和處理。

0
渭南市| 汝南县| 安顺市| 延寿县| 昌宁县| 安康市| 江城| 民勤县| 甘南县| 永靖县| 偃师市| 云霄县| 洛浦县| 武宣县| 南阳市| 专栏| 潮安县| 大安市| 湖北省| 汾阳市| 石门县| 通辽市| 万载县| 耒阳市| 金湖县| 福鼎市| 平果县| 洛南县| 石嘴山市| 金寨县| 宁津县| 宜章县| 英德市| 新密市| 南丰县| 怀仁县| 宜兰市| 萨迦县| 枣阳市| 五原县| 加查县|