中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python怎么實現分離圖片和文字

發布時間:2021-09-05 18:52:37 來源:億速云 閱讀:183 作者:chen 欄目:開發技術

這篇文章主要介紹“python怎么實現分離圖片和文字”,在日常操作中,相信很多人在python怎么實現分離圖片和文字問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”python怎么實現分離圖片和文字”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

本文實例為大家分享了python簡單實現圖片文字分割的具體代碼,供大家參考,具體內容如下

原圖:

python怎么實現分離圖片和文字

圖片預處理:圖片二值化以及圖片降噪處理。

# 圖片二值化
def binarization(img,threshold):
    #圖片二值化操作
    width,height=img.size
    im_new = img.copy()
    for i in range(width):
        for j in range(height):
            a = img.getpixel((i, j))
            aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
            if (aa <= threshold):
                im_new.putpixel((i, j), (0, 0, 0))
            else:
                im_new.putpixel((i, j), (255, 255, 255))

    # im_new.show()  # 顯示圖像
    return im_new
# 圖片降噪處理
def clear_noise(img):
    # 圖片降噪處理

    x, y = img.width, img.height
    for i in range(x-1):
        for j in range(y-1):
            if sum_9_region(img, i, j) < 600:
                # 改變像素點顏色,白色
                img.putpixel((i, j), (255,255,255))
    # img = np.array(img)
    #     # cv2.imwrite('handle_two.png', img)
    #     # img = Image.open('handle_two.png')
    img.show()
    return img

# 獲取田字格內當前像素點的像素值
def sum_9_region(img, x, y):
    """
    田字格
    """
    # 獲取當前像素點的像素值

    a1 = img.getpixel((x - 1, y - 1))[0]
    a2 = img.getpixel((x - 1, y))[0]
    a3 = img.getpixel((x - 1, y+1 ))[0]
    a4 = img.getpixel((x, y - 1))[0]
    a5 = img.getpixel((x, y))[0]
    a6 = img.getpixel((x, y+1 ))[0]
    a7 = img.getpixel((x+1 , y - 1))[0]
    a8 = img.getpixel((x+1 , y))[0]
    a9 = img.getpixel((x+1 , y+1))[0]
    width = img.width
    height = img.height

    if a5 == 255:  # 如果當前點為白色區域,則不統計鄰域值
        return 2550

    if y == 0:  # 第一行
        if x == 0:  # 左上頂點,4鄰域
            # 中心點旁邊3個點
            sum_1 = a5 + a6 + a8 + a9
            return 4*255 - sum_1
        elif x == width - 1:  # 右上頂點
            sum_2 = a5 + a6 + a2 + a3
            return 4*255 - sum_2
        else:  # 最上非頂點,6鄰域
            sum_3 = a2 + a3+ a5 + a6 + a8 + a9
            return 6*255 - sum_3

    elif y == height - 1:  # 最下面一行
        if x == 0:  # 左下頂點
            # 中心點旁邊3個點
            sum_4 = a5 + a8 + a7 + a4
            return 4*255 - sum_4
        elif x == width - 1:  # 右下頂點
            sum_5 = a5 + a4 + a2 + a1
            return 4*255 - sum_5
        else:  # 最下非頂點,6鄰域
            sum_6 = a5+ a2 + a8 + a4 +a1 + a7
            return 6*255 - sum_6

    else:  # y不在邊界
        if x == 0:  # 左邊非頂點
            sum_7 = a4 + a5 + a6 + a7 + a8 + a9
            return 6*255 - sum_7
        elif x == width - 1:  # 右邊非頂點
            sum_8 = a4 + a5 + a6 + a1 + a2 + a3
            return 6*255 - sum_8
        else:  # 具備9領域條件的
            sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
            return 9*255 - sum_9

經過二值化和降噪后得到的圖片

python怎么實現分離圖片和文字

對圖片進行水平投影與垂直投影:

# 傳入二值化后的圖片進行垂直投影
def vertical(img):
    """傳入二值化后的圖片進行垂直投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 開始投影
    for x in range(w):
        black = 0
        for y in range(h):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判斷邊界
    l,r = 0,0
    flag = False
    t=0#判斷分割數量
    cuts = []
    for i,count in enumerate(ver_list):
        # 閾值這里為0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))#記錄邊界點
            t += 1
    #print(t)
    return cuts,t

# 傳入二值化后的圖片進行水平投影
def horizontal(img):
    """傳入二值化后的圖片進行水平投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 開始投影
    for y in range(h):
        black = 0
        for x in range(w):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判斷邊界
    l,r = 0,0
    flag = False
    # 分割區域數
    t=0
    cuts = []
    for i,count in enumerate(ver_list):
        # 閾值這里為0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))
            t += 1
    return cuts,t

這兩段代碼目的主要是為了分割得到水平和垂直位置的每個字所占的大小,接下來就是對預處理好的圖片文字進行分割。

# 創建獲得圖片路徑并處理圖片函數
def get_im_path():

    OpenFile = tk.Tk()#創建新窗口
    OpenFile.withdraw()
    file_path = filedialog.askopenfilename()

    im = Image.open(file_path)
    # 閾值
    th = getthreshold(im) - 16
    print(th)
    # 原圖直接二值化
    im_new1 = binarization(im, th)
    im_new1.show()
    # 直方圖均衡化
    im1 = his_bal(im)
    im1.show()
    im_new_np = np.array(his_bal(im))

    th2 = getthreshold(im1) - 16
    print(th2)
    # 二值化
    im_new = binarization(im1, th2)
    # 降噪
    im_new_cn = clear_noise(im_new)
    height = im_new_cn.size[1]
    print(height)
    # 算出水平投影和垂直投影的數值
    v, vt = vertical(im_new1)
    h, ht = horizontal(im_new1)
    # 算出分割區域
    a = []
    for i in range(vt):
        a.append((v[i][0], 0, v[i][1], height))
    print(a)

    im_new.show()  # 直方圖均衡化后再二值化

    # 切割
    for i, n in enumerate(a, 1):
        temp = im_new_cn.crop(n)  # 調用crop函數進行切割
        temp.show()
        temp.save("c/%s.png" % i)

至此大概就完成了。

接下來是文件的全部代碼:

import numpy as np
from PIL import Image
import queue
import  matplotlib.pyplot as plt
import  tkinter as tk
from tkinter import filedialog#導入文件對話框函數庫

window = tk.Tk()
window.title('圖片選擇界面')
window.geometry('400x100')

var = tk.StringVar()


# 創建獲得圖片路徑并處理圖片函數
def get_im_path():

    OpenFile = tk.Tk()#創建新窗口
    OpenFile.withdraw()
    file_path = filedialog.askopenfilename()

    im = Image.open(file_path)
    # 閾值
    th = getthreshold(im) - 16
    print(th)
    # 原圖直接二值化
    im_new1 = binarization(im, th)
    im_new1.show()
    # 直方圖均衡化
    im1 = his_bal(im)
    im1.show()
    im_new_np = np.array(his_bal(im))

    th2 = getthreshold(im1) - 16
    print(th2)
    # 二值化
    im_new = binarization(im1, th2)
    # 降噪
    im_new_cn = clear_noise(im_new)
    height = im_new_cn.size[1]
    print(height)
    # 算出水平投影和垂直投影的數值
    v, vt = vertical(im_new1)
    h, ht = horizontal(im_new1)
    # 算出分割區域
    a = []
    for i in range(vt):
        a.append((v[i][0], 0, v[i][1], height))
    print(a)

    im_new.show()  # 直方圖均衡化后再二值化

    # 切割
    for i, n in enumerate(a, 1):
        temp = im_new_cn.crop(n)  # 調用crop函數進行切割
        temp.show()
        temp.save("c/%s.png" % i)

# 傳入二值化后的圖片進行垂直投影
def vertical(img):
    """傳入二值化后的圖片進行垂直投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 開始投影
    for x in range(w):
        black = 0
        for y in range(h):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判斷邊界
    l,r = 0,0
    flag = False
    t=0#判斷分割數量
    cuts = []
    for i,count in enumerate(ver_list):
        # 閾值這里為0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))#記錄邊界點
            t += 1
    #print(t)
    return cuts,t

# 傳入二值化后的圖片進行水平投影
def horizontal(img):
    """傳入二值化后的圖片進行水平投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 開始投影
    for y in range(h):
        black = 0
        for x in range(w):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判斷邊界
    l,r = 0,0
    flag = False
    # 分割區域數
    t=0
    cuts = []
    for i,count in enumerate(ver_list):
        # 閾值這里為0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))
            t += 1
    return cuts,t

# 獲得閾值算出平均像素
def getthreshold(im):
    #獲得閾值 算出平均像素
    wid, hei = im.size
    hist = [0] * 256
    th = 0
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3 * im.getpixel((i, j))[0] + 0.59 * im.getpixel((i, j))[1] + 0.11 * im.getpixel((i, j))[2])
            th = gray + th
            hist[gray] += 1


    threshold = int(th/(wid*hei))
    return threshold

# 直方圖均衡化 提高對比度
def his_bal(im):
    #直方圖均衡化 提高對比度

    # 統計灰度直方圖
    im_new = im.copy()
    wid, hei = im.size
    hist = [0] * 256
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
            hist[gray] += 1

    # 計算累積分布函數
    cdf = [0] * 256
    for i in range(256):
        if i == 0:
            cdf[i] = hist[i]
        else:
            cdf[i] = cdf[i - 1] + hist[i]

    # 用累積分布函數計算輸出灰度映射函數LUT
    new_gray = [0] * 256
    for i in range(256):
        new_gray[i] = int(cdf[i] / (wid * hei) * 255 + 0.5)

    # 遍歷原圖像,通過LUT逐點計算新圖像對應的像素值
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
            im_new.putpixel((i, j), new_gray[gray])
    return im_new

# 圖片二值化
def binarization(img,threshold):
    #圖片二值化操作
    width,height=img.size
    im_new = img.copy()
    for i in range(width):
        for j in range(height):
            a = img.getpixel((i, j))
            aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
            if (aa <= threshold):
                im_new.putpixel((i, j), (0, 0, 0))
            else:
                im_new.putpixel((i, j), (255, 255, 255))

    # im_new.show()  # 顯示圖像
    return im_new

# 圖片降噪處理
def clear_noise(img):
    # 圖片降噪處理

    x, y = img.width, img.height
    for i in range(x-1):
        for j in range(y-1):
            if sum_9_region(img, i, j) < 600:
                # 改變像素點顏色,白色
                img.putpixel((i, j), (255,255,255))
    # img = np.array(img)
    #     # cv2.imwrite('handle_two.png', img)
    #     # img = Image.open('handle_two.png')
    img.show()
    return img

# 獲取田字格內當前像素點的像素值
def sum_9_region(img, x, y):
    """
    田字格
    """
    # 獲取當前像素點的像素值

    a1 = img.getpixel((x - 1, y - 1))[0]
    a2 = img.getpixel((x - 1, y))[0]
    a3 = img.getpixel((x - 1, y+1 ))[0]
    a4 = img.getpixel((x, y - 1))[0]
    a5 = img.getpixel((x, y))[0]
    a6 = img.getpixel((x, y+1 ))[0]
    a7 = img.getpixel((x+1 , y - 1))[0]
    a8 = img.getpixel((x+1 , y))[0]
    a9 = img.getpixel((x+1 , y+1))[0]
    width = img.width
    height = img.height

    if a5 == 255:  # 如果當前點為白色區域,則不統計鄰域值
        return 2550

    if y == 0:  # 第一行
        if x == 0:  # 左上頂點,4鄰域
            # 中心點旁邊3個點
            sum_1 = a5 + a6 + a8 + a9
            return 4*255 - sum_1
        elif x == width - 1:  # 右上頂點
            sum_2 = a5 + a6 + a2 + a3
            return 4*255 - sum_2
        else:  # 最上非頂點,6鄰域
            sum_3 = a2 + a3+ a5 + a6 + a8 + a9
            return 6*255 - sum_3

    elif y == height - 1:  # 最下面一行
        if x == 0:  # 左下頂點
            # 中心點旁邊3個點
            sum_4 = a5 + a8 + a7 + a4
            return 4*255 - sum_4
        elif x == width - 1:  # 右下頂點
            sum_5 = a5 + a4 + a2 + a1
            return 4*255 - sum_5
        else:  # 最下非頂點,6鄰域
            sum_6 = a5+ a2 + a8 + a4 +a1 + a7
            return 6*255 - sum_6

    else:  # y不在邊界
        if x == 0:  # 左邊非頂點
            sum_7 = a4 + a5 + a6 + a7 + a8 + a9
            return 6*255 - sum_7
        elif x == width - 1:  # 右邊非頂點
            sum_8 = a4 + a5 + a6 + a1 + a2 + a3
            return 6*255 - sum_8
        else:  # 具備9領域條件的
            sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
            return 9*255 - sum_9

btn_Open = tk.Button(window,
    text='打開圖像',      # 顯示在按鈕上的文字
    width=15, height=2,
    command=get_im_path)     # 點擊按鈕式執行的命令

btn_Open.pack()


# 運行整體窗口
window.mainloop()

到此,關于“python怎么實現分離圖片和文字”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

太康县| 康马县| 嘉禾县| 新津县| 白朗县| 海伦市| 精河县| 沿河| 扎囊县| 呼和浩特市| 黄陵县| 定州市| 竹山县| 浠水县| 剑河县| 鲁甸县| 清涧县| 鄂托克前旗| 诸城市| 兰考县| 新巴尔虎右旗| 井冈山市| 遂宁市| 靖安县| 城市| 英吉沙县| 云安县| 五寨县| 常德市| 繁昌县| 平武县| 庆安县| 威信县| 大连市| 伊金霍洛旗| 五华县| 大城县| 南溪县| 陈巴尔虎旗| 洪雅县| 伊金霍洛旗|