中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中OpenCV針對圖像細節有哪些操作技巧

發布時間:2021-08-17 09:06:28 來源:億速云 閱讀:126 作者:小新 欄目:開發技術

這篇文章主要為大家展示了“Python中OpenCV針對圖像細節有哪些操作技巧”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Python中OpenCV針對圖像細節有哪些操作技巧”這篇文章吧。

 在 Python OpenCV 針對圖像細節的不同操作

將為你解釋一幅圖像的拆解,包括圖像像素的說明,圖像屬性信息的獲取與修改,
圖像目標區域 ROI 相關內容,以及圖像通道的知識(包括拆分通道和合并通道)

這些內容在知識結構上與 numpy 庫十分緊密,如果從學習的角度出發,建議你儲備一下 numpy 相關知識。

讀取修改圖像的像素值

在之前的博客中,我們已經學到了如何讀取一幅圖像,使用 cv2.imread 函數即可,并且掌握了該函數的兩個關鍵參數。

讀取圖片之后,我們可以直接使用操作數組的方式獲取圖像任意位置的顏色,一般這個顏色的默認順序是 BGR。

測試代碼如下:

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 獲取 100 x 100 位置的像素值
print(src[100, 100])

cv2.imshow("src", src)

cv2.waitKey()

這里首先獲取 100 x 100 位置的像素值。
src[100,100]會獲取到三個值,分別對應的 BGR 通道的值。我們在圖片上標記一個像素點,rows = 250,cols=470 ,接下來修改上述代碼,看獲取到的 BGR 值。

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意獲取像素值的格式為 [cols,rows]
print(src[250, 470])

cv2.imshow("src", src)

cv2.waitKey()

Python中OpenCV針對圖像細節有哪些操作技巧

上文特別注意的就是,獲取像素值的格式為 [cols,rows],列在前,行在后。

以上獲取到的是 BGR 值,也可以只獲取單個通道的值,對應的代碼是 [cols,rows,channel],對應到代碼部分,如下所示:

# 獲取藍色通道值
print(src[250, 470, 0])

藍色通道對應 0,綠色通道為 1,紅色通道為 2,超出以上三個值,就會出現如下錯誤:

IndexError: index 3 is out of bounds for axis 2 with size 3

當前如果你直接讀取了灰度圖,例如下述代碼,三個通道的值是相同的。

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg", 0)

# 注意獲取像素值的格式為 [cols,rows]
print(src[250, 470])

cv2.imshow("src", src)

cv2.waitKey()

這個地方還有一個編碼上存在的潛在問題,如果讀取的是四通道圖片,即圖片有透明度,那數組的索引值可以讀取到 3,也就是下述代碼是正確的。

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./test.jpg", -1)

# 注意獲取像素值的格式為 [cols,rows]
print(src[250, 470, 3])

cv2.imshow("src", src)

cv2.waitKey()

src[250, 470, 3] 成功讀取到了透明通道的值。

我們可以針對特定的像素點進行值的修改,例如下述代碼

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意獲取像素值的格式為 [cols,rows]
src[250, 470] = [255, 255, 255]

cv2.imshow("src", src)

cv2.waitKey()

注意下圖的紅色箭頭指向的位置,出現一個白色亮點,使用該辦法,可以制造出一個【椒鹽圖片】。

Python中OpenCV針對圖像細節有哪些操作技巧

這個地方需要注意的一個潛在 BUG,讀取圖片的通道數,決定了你復制時數組元素個數,例如下述代碼將會報錯。

import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意獲取像素值的格式為 [cols,rows]
src[250, 470] = [255, 255, 255, 255]

cv2.imshow("src", src)

cv2.waitKey()

錯誤信息都是類似的,提示數組維度不同。

ValueError: cannot copy sequence with size 4 to array axis with dimension 3

最后一點使用以上方式操作圖像的像素點,非常耗時,因為一張圖片的像素點數據是非常大的,一般情況下能用 numpy 集成好的方法,就不要用這種最笨拙的方式。

使用 numpy 獲取通道值,注意該方式獲取的是標量,如果你想獲得所有 BGR 的值,你需要使用 array.item() 依次獲取。

import cv2
import numpy as np

src = cv2.imread("./6_test.jpg")
print(src[100, 100])
b = src.item(100, 100, 0)
g = src.item(100, 100, 1)
r = src.item(100, 100, 2)
print(b, g, r)

cv2.imshow("src", src)
cv2.waitKey()

如果希望設置該值,直接使用 itemset 函數即可。

src.itemset((100, 100, 0), 200)
print(src[100, 100])

可以任意尋找一張圖片進行對應的測試,運行效果如下:

[ 31 68 118]
31 68 118
[200 68 118]

OpenCV 中圖像屬性常見問題解析

對于一幅圖像,除了像素矩陣以外,還有一個非常重要的內容,是圖像的屬性,這些包括行、列、通道、數據類型,像素數量、圖像形狀等內容。

例如,我們經常使用 img.shape 去獲取圖像的形狀,尤其注意的是,返回的內容是行數(rows),列數(cols),以及通道數(channels),并且返回值類型是一個元組。

如果你讀取圖像的時候,設置緊讀取灰度圖,那只會返回行數和列數,相應的通過這個值很容易能判斷出你加載的圖像類型。

例如下述代碼,通過不同的方式讀取同一張圖片,輸出圖像的不同形狀。

import cv2
import numpy as np

# 選擇一個 jpg 圖片,可以讀取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
# 灰度圖
print(src2.shape)
# 三通道
print(src3.shape)

輸出結果可以快速的讀取出圖像是彩色圖像還是灰度圖像。

(397, 595, 4)
(397, 595)
(397, 595, 3)

使用 img.size 可以快速返回圖像中像素的合計數目,測試代碼如下:

# 選擇一個 jpg 圖片,可以讀取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
print(src1.size)
# 灰度圖
print(src2.shape)
print(src2.size)
# 三通道
print(src3.shape)
print(src3.size)

我們依舊三種不同的讀取方式,讀取到的像素數分別如下:

(397, 595, 4)
944860
(397, 595)
236215
(397, 595, 3)
708645

注意,灰度圖像和彩色圖像的像素數不同,它們之前存在如下關系。

灰度圖像的像素數 = 行數 x 列數 = 397 x 595 = 236215

彩色圖像的像素數 = 行數 x 列數 x 通道數 = 944860 (四通道)/ 708645(三通道)

使用 img.dtype 屬性可以獲取到圖像的類型,具體如下:

print(src1.dtype)

這里讀取到的值,都是相同的 uint8 表示 8 位圖像,這里可以記住只要是 uint8 格式,那對應的 BGR 值的范圍就是在 [0,255] 之間。

在操作上述屬性值的時候,會出現如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別注意下:

AttributeError: 'NoneType' object has no attribute 'shape'
print(src1.dtype)

這里讀取到的值,都是相同的 uint8 表示 8 位圖像,這里可以記住只要是 uint8 格式,那對應的 BGR 值的范圍就是在 [0,255] 之間。

在操作上述屬性值的時候,會出現如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別注意下:

AttributeError: 'NoneType' object has no attribute 'shape'

以上是“Python中OpenCV針對圖像細節有哪些操作技巧”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

上栗县| 高碑店市| 竹北市| 旺苍县| 洛阳市| 桑日县| 手游| 聂拉木县| 金川县| 赤峰市| 朝阳区| 阿合奇县| 长丰县| 济源市| 介休市| 海兴县| 平远县| 阿克陶县| 阿荣旗| 巴林右旗| 监利县| 文昌市| 波密县| 潼关县| 灵台县| 江油市| 阳春市| 聊城市| 泗洪县| 镇宁| 冕宁县| 崇仁县| 邛崃市| 宝丰县| 突泉县| 东丽区| 红原县| 腾冲县| 泰州市| 和田市| 河北省|