中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中怎么從圖像中讀取文本

發布時間:2021-07-10 16:11:42 來源:億速云 閱讀:182 作者:Leah 欄目:編程語言

本篇文章為大家展示了Python中怎么從圖像中讀取文本,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

OpenCV

現在,這個庫將只用于加載圖像,實際上你不需要事先對它有太多了解(盡管它可能有幫助,你將看到為什么)。

根據官方文件:

OpenCV(開源計算機視覺庫)是一個開源的計算機視覺和機器學習軟件庫。OpenCV的目的是為計算機視覺應用提供一個通用的基礎結構,并加速機器感知在商業產品中的使用。OpenCV是bsd許可的產品,OpenCV使企業可以輕松地使用和修改代碼

簡而言之,你可以使用OpenCV來做任何類型的圖像轉換,這是一個相當簡單的庫。

如果你還沒有安裝它,那么它將只是終端中的一行:

pip install opencv-python

差不多就是這樣。在此之前,一切都很簡單,但這種情況即將改變。

PyTesseract

這個庫到底是什么東西?根據維基百科:

Tesseract是用于各種操作系統的光學字符識別引擎。它是免費軟件,根據Apache許可2.0版發布,自2006年以來由Google贊助開發。

我敢肯定,現在有更多復雜的庫可用,但是我發現這個庫運行良好。根據我自己的經驗,該庫應該能夠從任何圖像中讀取文本,但前提是該字體不會使你連連看都看不懂。

如果無法從你的圖像中讀取文字,花更多的時間使用OpenCV,應用各種過濾器使文本高亮。

現在安裝在底部有些麻煩。如果你使用的是Linux,則全部歸結為幾個sudo-apt get命令:

sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev

我用的是Windows系統,所以這個過程有點乏味。

首先,打開這個URL:https://github.com/UB-Mannheim/tesseract/wiki下載32位或64位的安裝程序:

Python中怎么從圖像中讀取文本

安裝本身很簡單,只需單擊幾次Next。是的,你還需要做一個pip安裝:

pip install pytesseract

接下來要需要告訴Python  Tesseract安裝在何處。在Linux機器上,我不需要這樣做,但在Windows上是必需的。默認情況下,它安裝Program Files。

如果你做的一切正確,執行這些代碼應該不會產生任何錯誤:

Python中怎么從圖像中讀取文本

獲取文本

讓我們從一個簡單的開始。我找到了一些免版稅的圖片,里面有一些文字,第一個是這樣的:

Python中怎么從圖像中讀取文本

它應該是簡單的一個,有可能Tesseract會讀那些藍色的“對象”作為括號。讓我們看看會發生什么:

Python中怎么從圖像中讀取文本

我的猜測是正確的。不過,這不是一個問題,你可以使用一些Python技巧輕松地解決這些問題。

下一個可能更棘手:

Python中怎么從圖像中讀取文本

我希望它不會檢測到硬幣上的“B”:

Python中怎么從圖像中讀取文本

上述內容就是Python中怎么從圖像中讀取文本,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

梅河口市| 安西县| 怀远县| 襄樊市| 招远市| 雷波县| 叶城县| 高要市| 仙居县| 蓬安县| 土默特左旗| 林口县| 洱源县| 泌阳县| 日喀则市| 鄱阳县| 札达县| 旌德县| 白朗县| 曲水县| 佛山市| 垫江县| 乐昌市| 浦县| 筠连县| 丽江市| 固始县| 洛隆县| 临武县| 新乡县| 锦州市| 永登县| 寻甸| 揭西县| 涿州市| 南部县| 德州市| 东乡族自治县| 中阳县| 三门峡市| 延安市|