中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么用Python代碼實現文字識別功能

發布時間:2022-05-10 16:26:10 來源:億速云 閱讀:573 作者:iii 欄目:開發技術

今天小編給大家分享一下怎么用Python代碼實現文字識別功能的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。

1.環境和配置要求

整體是用Python實現,所需要使用的第三方庫包括aip、PIL、keyboard、pyinstaller,如未安裝,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安裝。

百度接口

打開網址,如未注冊請先注冊,然后登錄點擊管理控制臺,點擊左側產品服務→人工智能→文字識別,點擊創建應用,輸入應用名稱如Baidu_OCR,選擇用途如學習辦公,最后進行簡單應用描述,即可點擊立即創建。會出現應用列表,包括AppID、API Key、Secret Key等信息,這些稍后會用到。

怎么用Python代碼實現文字識別功能

怎么用Python代碼實現文字識別功能

2.具體實現步驟

整個程序的大致思路是,在用截圖軟件獲得截圖之后,交給百度接口識別,并返回結果,當然,也可以是本地圖片識別,我用的是QQ自帶截圖軟件,快捷鍵CTRL+ALT+A用來打開截圖,在選中所截區域后,按Enter鍵即可保存到粘貼板中,也可用其他截圖軟件。

獲取截圖

keyboard類庫是用來監聽鍵盤動作的,所以在有快捷鍵按下之后,便會有相應動作。并用PIL中的ImageGrab來獲取到剪切板中的圖片并生成本地圖片文件。

#1.截圖
keyboard.wait('ctrl+alt+a')
print('開始截圖')
 
keyboard.wait('enter')
print('保存截圖')
time.sleep(0.1)
 
#2.保存圖片
image = ImageGrab.grabclipboard()
image.save('img.png')

調用Baidu aip識別并打印文字

先用注冊時生成的應用的AppID、API Key、Secret Key初始化應用,再讀取保存到的圖片并打印識別的文字。

with open('img.png', 'rb') as fp:
    image = fp.read()
    text_list = client.basicAccurate(image)['words_result']
    for text in text_list:
        print(text['words'])

運行結果如圖所示:

怎么用Python代碼實現文字識別功能

我們還可增加一個無限循環使得一直能截圖。

調用打包程序生成專屬識別文字小程序

用pyinstaller庫實現小程序的打包,生成.exe文件,這樣就能隨時識別文字了。在命令行中用pyinstaller xxx.py來打包生成exe文件,最后在生成的dist文件夾即可找到xxx.exe文件如下:

怎么用Python代碼實現文字識別功能

最后附上整個源代碼:

#引入截圖軟件,獲取文件到本地端,并識別圖片文字,最后打包
import keyboard #控制鍵盤
from PIL import ImageGrab #保存圖片
import time
from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '17076767'
API_KEY = 'Af3Rj5HALMz5AN8prSgwTH4m'
SECRET_KEY = '******************'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
i = 0

while True:
    #1.截圖
    keyboard.wait('ctrl+alt+a')
    print('開始截圖')

    keyboard.wait('enter')
    print('保存截圖')
    time.sleep(0.1)

    #2.保存圖片
    image = ImageGrab.grabclipboard()
    image.save('img{}.png'.format(i))


    """ 調用通用文字識別(高精度版) """

    with open('img{}.png'.format(i), 'rb') as fp:
        image = fp.read()
        text_list = client.basicAccurate(image)['words_result']
        for text in text_list:
            print(text['words'])

    i+=1

附圖圖片識別案例

怎么用Python代碼實現文字識別功能

以上就是“怎么用Python代碼實現文字識別功能”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

延寿县| 永平县| 修文县| 临邑县| 仁化县| 新民市| 永昌县| 教育| 平和县| 库伦旗| 商洛市| 舞阳县| 阳城县| 西华县| 江安县| 涿鹿县| 泰顺县| 桂阳县| 禄丰县| 湟中县| 兴隆县| 玉田县| 东至县| 公安县| 昌邑市| 定陶县| 达拉特旗| 开化县| 黑龙江省| 汪清县| 喀什市| 鄂州市| 上虞市| 蓝田县| 郎溪县| 彰化市| 濉溪县| 顺义区| 眉山市| 西吉县| 临西县|