中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》
  • 首頁 > 
  • 教程 > 
  • 開發技術 > 
  • 【圖像識別】圖像識別過程中,計算的圖片大小多少為合適?

【圖像識別】圖像識別過程中,計算的圖片大小多少為合適?

發布時間:2020-10-16 06:09:48 來源:網絡 閱讀:2308 作者:rdqiqi 欄目:開發技術

摘自自運營微信定閱號 創心思考 ,搜索關注獲得更多內容!


圖像識別的類型大致可以分為3種


1,條碼,二維碼:這種一般應用場景及圖片規則比較明確,計算量較小,App本地就可以處理。

2,文字識別類:由于采集的圖片的多樣化,文本的展現形式(字體,排版)不同,識別的過程中需要輔助的方法(如圈選,點選,焦點對齊)及云端進行結果優化

3,面部識別類:這部分的能力大部分依賴于云端及面部特征集的訓練。


今天重點討論文字識別類的過種應該以多大的尺寸圖片數據作為依據。

我們先了解一下文字識別的過種

1,選擇一張圖片(拍照,攝相,相冊,網頁或應用中的某張圖)

2,將圖片進行二值化,分為前景及背景,(注意了:一張圖中有多種文字顏色)

3,噪聲去掉,這塊算法真心不理解,

4,傾斜矯正,通過算法驗證照片是拍照時否有傾斜,同時將其矯正,后續

5,字符切割,將每個字符或單詞摘出

6,字符識別,對應的字符與字庫進行比對或使用特征提取的方法識別出文字


那么問題來了,由于圖片的來源不確定,文字信息在圖片中的大小比例也不確定。所有的工作都交給識別模塊來處理,工作量是不是會很大?如果需要云端介入,網絡的傳輸數據量會不會影響應時長?


好吧,我們假定一下圖片的來源分析

1,照相及攝相:這類圖片的產生來自于用戶對于當前環境中的某件承載文字的物品的識別,才會使用手機進行拍照或攝像記錄下文字信息。我們試的想一下,這時手機的屏幕為取景器,用戶在照相或攝相時肯定會要保證關注的內容可見。那么這時,我們可以使用手機屏幕作為最大圖片尺寸即可有效的識別出圖片內的文字,無論手機的相素是500W,還是1500W。

2,從相冊中選取:這類圖片的來源比較多,可以是相機,其它應用,瀏覽器。但終究是在手機的屏幕下看到了該圖的內容后,才會進行識別。

3,應用或瀏覽器:這些圖片的內容源大部分都會進行尺寸優化,以減少網絡流量及提高用戶體驗。

結論來了

圖片的尺寸參考屏幕的尺寸進行縮放,這個圖片應該是有效的!

如果不無效呢,是不是有必要針對特殊的圖片進行手動的放大及縮小呢?

其實還是眼見為實,這是用戶的心理及預期!!!

剩下的呢?

那就讓用戶自已選擇他關注的內容吧,參考之前的圖片縮放比值信息,再把選擇的內容截取出來,產生的圖片應該是數據量最少且有效的方案了。。。


摘自自運營微信定閱號 創心思考 ,搜索關注獲得更多內容!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

清水县| 天台县| 湾仔区| 渭源县| 邢台市| 抚州市| 和平县| 称多县| 陇南市| 崇仁县| 太原市| 无锡市| 甘南县| 图们市| 鸡西市| 尉犁县| 武鸣县| 余江县| 乐东| 龙泉市| 汕尾市| 巴马| 连南| 鄂伦春自治旗| 白山市| 瓮安县| 鄂尔多斯市| 莱西市| 资兴市| 阿合奇县| 衢州市| 陈巴尔虎旗| 渑池县| 虞城县| 上饶县| 新野县| 松原市| 秦皇岛市| 临潭县| 嘉鱼县| 仙居县|