您好,登錄后才能下訂單哦!
本篇內容介紹了“Python如何生成字符視頻”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
在之前也寫過生成字符視頻的文章,但是使用的是命令行窗口輸出,效果不是很好,而且存在卡頓的情況。于是我打算直接生成一個mp4的字符視頻。大致思路和之前一樣:Python20行代碼實現視頻字符化。
我們先來看一些基本操作。首先我們需要安裝OpenCV,執行下面語句:
pip install opencv-python
之后就可以使用了。
我們直接看代碼:
import cv2
# 讀取圖片
img = cv2.imread("1.jpg")
# 顯示圖片
cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()
其中waitKey是等待輸入的函數,因為imshow之后顯示一瞬間,所以我們需要調用它。而destroyAllWindows是釋放窗口。
灰度轉換就是將圖片轉換成黑白圖片(灰色),這樣可以方便我們處理像素。代碼如下:
import cv2
img = cv2.imread("1.jpg")
# 灰度轉換
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
我們還可以直接以灰度形式讀入:
import cv2
# 以灰度形式讀入
img = cv2.imread("1.jpg", 0)
我們直接看代碼:
import cv2
img = cv2.imread("1.jpg", 0)
# 獲取圖片的高寬
h, w = img.shape
# 縮放圖片
res = cv2.resize(img, (w//2, h//2))
因為img的shape屬性是一個元組,所以我們可以直接自動拆包。
然后調用cv2.resize函數,第一個參數傳入圖片,第二個參數傳入修改后的尺寸。
繪制文字我們需要調用cv2.putText函數,代碼如下:
import cv2
img = cv2.imread('1.jpg')
# 繪制文字
cv2.putText(
# 背繪制的圖片
img,
# 要繪制的文字
'Hello',
# 文字左下角的坐標
(100, 500),
# 字體
cv2.FONT_HERSHEY_SIMPLEX,
# 字體大小縮放
20,
# 文字顏色
(0, 0, 0),
# 文字粗細
10
)
我們只需要注意這些參數就好了。
讀取視頻的操作一般是通用的,代碼如下:
import cv2
# 讀取視頻
cap = cv2.VideoCapture('1.mp4')
# 獲取視頻的幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 循環讀取圖片的每一幀
while True:
# 讀取下一幀
ret, frame = cap.read()
if not ret:
break
else:
pass
cap.release()
上面我們獲取的視頻的幀,在寫入視頻的時候我們需要用到。
寫入視頻的操作也是常規代碼:
import cv2
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter('11.mp4', fourcc, fps, (w, h))
# 寫入視頻
writer.write(frame)
***
write.release()
有了這些知識,我們就可以開始下一步工作了。
對于只有一個通道的圖片,我們可以把它當成一個矩形,這個矩形最小單位就是一個像素。而字符化的過程就是用字符替代像素點的過程。所以我們要遍歷圖像的每個像素點,但是我們應該用什么字符取代呢?
我們顏色有一個參照表,而opencv將這個參數表切割成256份,代表不同的程度,我們也可以做一個參照表,不過表中的內容不是顏色,而是字符。
下面就是我們像素轉字符的代碼:
def pixel2char(pixel):
char_list = "@#$%&erytuioplkszxcv=+---. "
index = int(pixel / 256 * len(char_list))
return char_list[index]
這個字符表是可以自己定義的。
現在我們只需要將像素逐個轉換成字符就好了,代碼如下:
def get_char_img(img, scale=4, font_size=5):
# 調整圖片大小
h, w = img.shape
re_im = cv2.resize(img, (w//scale, h//scale))
# 創建一張圖片用來填充字符
char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
font = cv2.FONT_HERSHEY_SIMPLEX
# 遍歷圖片像素
for y in range(0, re_im.shape[0]):
for x in range(0, re_im.shape[1]):
char_pixel = pixel2char(re_im[y][x])
cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
return char_img
這里我們使用了一個np.ones函數,它的作用我們理解為生成一個黑色圖片。
生成的尺寸我們先除了scale,如何再乘font_size。scale是原圖的縮小程度,因為像素有很多,所以我們需要先把圖片縮小。而為了讓我們的字體顯示更清楚,我們需要把生成的字符圖片放大。
因此需要注意,雖然我們生成的圖片看起來單調,但是當font_size設置為5時,得到的圖片已經比較大了。因此當你生成長時間的視頻時,會花費比較多的時間,生成的視頻也比較大。
我們來測試一下上面的函數:
import cv2
import numpy as np
def pixel2char(pixel):
char_list = "@#$%&erytuioplkszxcv=+---. "
index = int(pixel / 256 * len(char_list))
return char_list[index]
def get_char_img(img, scale=4, font_size=5):
# 調整圖片大小
h, w = img.shape
re_im = cv2.resize(img, (w//scale, h//scale))
# 創建一張圖片用來填充字符
char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
font = cv2.FONT_HERSHEY_SIMPLEX
# 遍歷圖片像素
for y in range(0, re_im.shape[0]):
for x in range(0, re_im.shape[1]):
char_pixel = pixel2char(re_im[y][x])
cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
return char_img
if __name__ == '__main__':
img = cv2.imread('dl.jpg', 0)
res = get_char_img(img)
cv2.imwrite('d.jpg', res)
有了上面的代碼,我們就可以對整個視頻進行轉換了。將視頻轉換成字符視頻的代碼如下:
def generate(input_video, output_video):
# 1、讀取視頻
cap = cv2.VideoCapture(input_video)
# 2、獲取視頻幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 讀取第一幀,獲取轉換成字符后的圖片的尺寸
ret, frame = cap.read()
char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)
# 創建一個VideoWriter,用于保存視頻
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
while ret:
# 讀取視頻的當前幀,如果沒有則跳出循環
ret, frame = cap.read()
if not ret:
break
# 將當前幀轉換成字符圖
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
char_img = get_char_img(gray, 4)
# 轉換成BGR模式,便于寫入視頻
char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
writer.write(char_img)
writer.release()
完整代碼如下:
import cv2
import numpy as np
def pixel2char(pixel):
char_list = "@#$%&erytuioplkszxcv=+---. "
index = int(pixel / 256 * len(char_list))
return char_list[index]
def get_char_img(img, scale=4, font_size=5):
# 調整圖片大小
h, w = img.shape
re_im = cv2.resize(img, (w//scale, h//scale))
# 創建一張圖片用來填充字符
char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
font = cv2.FONT_HERSHEY_SIMPLEX
# 遍歷圖片像素
for y in range(0, re_im.shape[0]):
for x in range(0, re_im.shape[1]):
char_pixel = pixel2char(re_im[y][x])
cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
return char_img
def generate(input_video, output_video):
# 1、讀取視頻
cap = cv2.VideoCapture(input_video)
# 2、獲取視頻幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 讀取第一幀,獲取轉換成字符后的圖片的尺寸
ret, frame = cap.read()
char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)
# 創建一個VideoWriter,用于保存視頻
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
while ret:
# 讀取視頻的當前幀,如果沒有則跳出循環
ret, frame = cap.read()
if not ret:
break
# 將當前幀轉換成字符圖
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
char_img = get_char_img(gray, 4)
# 轉換成BGR模式,便于寫入視頻
char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
writer.write(char_img)
writer.release()
if __name__ == '__main__':
generate('in.mp4', 'out.mp4')
我們只需要修改generate的參數就好了。
“Python如何生成字符視頻”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。