中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

OCR識別的技術流程解析1

發布時間:2020-08-10 16:42:03 來源:ITPUB博客 閱讀:217 作者:RUIxiansen 欄目:編程語言

一、 OCR識別預處理:灰度化(如果是彩色圖像)、降噪、二值化、字符切分以及歸一化這些子步驟。經過二值化后,圖像只剩下兩種顏色,即黑和白,其中一個是圖像背景,另一個顏色就是要識別的文字了;降噪在這個階段非常重要,降噪算法的好壞對特征提取的影響很大。字符切分則是將圖像中的文字分割成單個文字——識別的時候是一個字一個字識別的。如果文字行有傾斜的話往往還要進行傾斜校正。歸一化則是將單個的文字圖像規整到同樣的尺寸,在同一個規格下,才能應用統一的算法。

OCR識別的技術流程解析1

二、特征提取和降維:特征是用來識別文字的關鍵信息,每個不同的文字都能通過特征來和其他文字進行區分。對于數字和英文字母來說,這個特征提取是比較容易的,因為數字只有10個,英文字母只有52個,都是小字符集。對于漢字來說,特征提取比較困難,因為首先漢字是大字符集,國標中光是最常用的第一級漢字就有3755個;第二個漢字結構復雜,形近字多。在確定了使用何種特征后,視情況而定,還有可能要進行特征降維,這種情況就是如果特征的維數太高(特征一般用一個向量表示,維數即該向量的分量數),分類器的效率會受到很大的影響,為了提高識別速率,往往就要進行降維,這個過程也很重要,既要降低維數吧,又得使得減少維數后的特征向量還保留了足夠的信息量(以區分不同的文字)。

OCR識別的技術流程解析1

三、分類器設計、訓練和實際識別:分類器是用來進行識別的,就是對于第二步,對一個文字圖像,提取出特征給分類器,分類器就對其進行分類,告訴你這個特征該識別成哪個文字。在進行實際識別前,往往還要對分類器進行訓練,這是一個監督學習的案例。

四、 OCR識別后處理:后處理是用來對分類結果進行優化的,第一,分類器的分類有時候不一定是完全正確的,比如對漢字的識別,由于漢字中形近字的存在,很容易將一個字識別成其形近字。后處理中可以去解決這個問題,比如通過語言模型來進行校正——如果分類器將“在哪里”識別成“存哪里”,通過語言模型會發現“存哪里”是錯誤的,然后進行校正。第二, OCR識別圖像往往是有大量文字的,而且這些文字存在排版、字體大小等復雜情況,后處理中可以嘗試去對識別結果進行格式化,比如按照圖像中的排版排列。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

雷州市| 鞍山市| 西乡县| 英山县| 崇信县| 乌拉特前旗| 南宫市| 青神县| 吴江市| 澳门| 田东县| 宁都县| 永清县| 江门市| 盘山县| 铜梁县| 华亭县| 巢湖市| 安阳县| 偏关县| 嘉兴市| 利辛县| 武城县| 昌都县| 越西县| 六枝特区| 鹤庆县| 彝良县| 神农架林区| 自贡市| 广元市| 蕉岭县| 庆安县| 民勤县| 南丰县| 台东县| 普安县| 象山县| 越西县| 屯留县| 名山县|