中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

淺析Python 實現一個自動化翻譯和替換的工具

發布時間:2020-08-30 11:54:11 來源:腳本之家 閱讀:172 作者:學好Python吧 欄目:開發技術

一個可能你似曾相識的場景

閱讀內容包含大量英文的 PPT、Word、Excel 或者記事本時,由于英語不熟悉,為了流利地閱讀,需要打開瀏覽器進入谷歌翻譯的主界面,然后把英文復制到谷歌翻譯的輸入框中,最后又把翻譯結果復制回 PPT、Word 和 Excel。

淺析Python 實現一個自動化翻譯和替換的工具

淺析Python 實現一個自動化翻譯和替換的工具

要是一個兩個單詞還好,要是發現有 100 個單詞不認識,就必須復制粘貼 200 次,如此機械性重復性的工作,應該交給程序來做,這就是我設計下面這個自動化翻譯工具的初衷。

提升辦公效率的法寶

淺析Python 實現一個自動化翻譯和替換的工具

如上圖所示,運行程序并保持后臺運行,在電腦上的任何一個軟件中選擇一段文本,并 Ctrl + C 復制到系統剪貼板中,程序就會自動幫助我們完成翻譯,并將翻譯結果自動復制到系統剪貼版中,只需 Ctrl + V,就完成了翻譯結果對原文的替換。

編碼實現

程序主要分為兩部分,第一部分為谷歌翻譯爬蟲,第二部分就是實現這個將翻譯結果自動替換的業務邏輯。

谷歌翻譯爬蟲

通過瀏覽器 F12 開發者工具,很容易定位到翻譯請求的URL:http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2

這個請求接受兩個參數,一個就是我們要翻譯的字符串 q,另一個是用于用戶認證的 tk(token),其中 q 很容易構造,tk 的構造就需要花費一番心力了,需要我們調試 js 代碼,這里參考 Github 上大神的輪子: https://github.com/cocoa520/Google_TK

谷歌翻譯爬蟲的主要代碼如下:

 def translate(tk, content): 
 if len(content) > 4891: 
  print("too long to translate")
   return 
 param = {'tk': tk, 'q': content} 
 result = requests.get("""http://translate.google.cn/translate_a/single?client=t&sl=en  
&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss  
 &dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1&srcrom=0&ssel=0&tsel=0&kc=2""", params=param) 
data = result.json()
 print(data[0][0][0])

返回結果是 json 形式的,翻譯結果保存在結果的第一個元組中。

Python 操作系統剪貼板

將讀取剪貼板的內容的代碼封裝成函數如下:

 def getText():#讀取剪切板
  # 打開剪貼板
  w.OpenClipboard()
 # 讀取剪貼板的內容 
 d = w.GetClipboardData(win32con.CF_TEXT)
  # 關閉剪貼板
  w.CloseClipboard()
 try:  
return d.decode('utf-8')
 except:  
 return d.decode('gbk')

返回值 d 是字節類型的,需要解碼,中文按 gbk 格式解碼,英文按 utf-8 解碼。

類似地,寫入剪貼板的代碼如下:

def setText(aString):#寫入剪切板
 # 打開剪貼板
 w.OpenClipboard()
 # 清空剪貼板
 w.EmptyClipboard()
 # 寫入剪貼板
 w.SetClipboardText(aString)
 # 關閉剪貼板
 w.CloseClipboard()

實現將翻譯結果自動替換原文的邏輯的代碼如下:

 while(True):
   # 如果剪貼板正在被占用 
  try:
   cs = getText() 
  except: 
   time.sleep(1)
    cs = getText() 
  print('cs',cs) 
  if cs and cs != ls:
   print('準備翻譯')
   content = getText()  
 tk = js.getTk(content)
   res = translate(tk, content)14   setText(res)
   time.sleep(1)
   ls = res

值得注意的是,系統剪貼板對象是單例模式的,在操作系統范圍內只有一個,而且讀寫剪貼板都是互斥的,在讀(寫)剪貼板的同時不允許任何對剪貼板的寫(讀)操作。試想這樣一種情景,我們在其他軟件中 Ctrl + C 寫入剪貼板,而此時我們的程序代碼正好執行到讀剪貼板那一行,毫無疑問會報錯,我的解決辦法是使用 try…except 語句延時 1 s再讀取,這樣可以大大降低讀寫碰撞的概率,但無疑消耗了程序性能。

總結

以上所述是小編給大家介紹的Python 實現一個自動化翻譯和替換的工具,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復大家!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

凤城市| 综艺| 拉萨市| 临桂县| 静宁县| 淳化县| 和顺县| 莱芜市| 永春县| 五河县| 牟定县| 清新县| 客服| 雷波县| 商城县| 敦化市| 星座| 湘潭县| 遵义县| 屯留县| 武陟县| 景宁| 舒城县| 万源市| 昌都县| 额敏县| 呼和浩特市| 扎赉特旗| 新安县| 陆丰市| 牡丹江市| 马山县| 和林格尔县| 东安县| 南皮县| 忻州市| 阜康市| 鹤峰县| 睢宁县| 肃南| 固始县|