中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python任意字符集轉換

發布時間:2020-07-01 17:31:19 來源:網絡 閱讀:582 作者:楊云1028 欄目:編程語言

在python處理文本的過程中,經常會有文本字符集轉換的情況,
而我們希望用一個方法,不用關心文本原本的字符集是什么樣的,直接轉換成想要的任何字符集就可以了。

方法一:

import chardet  
def convert_encoding(data,new_coding='UTF-8'):
  # 任意字符集轉換
  encoding = chardet.detect(data)['encoding']
  if new_coding.upper() != encoding.upper():
    data  = data.decode(encoding,data).encode(new_coding)
  return data 

方法二:

import icu  
def convert_encoding2(data,new_coding='UTF-8'):

  encoding = icu.CharsetDetector(data).detect().getName()  
  # encoding = chardet.detect(content)['encoding']
  if new_coding.upper() != encoding.upper():
    # data  = data.decode(encoding,data).encode(new_coding)
    data = unicode(data,coding).encode(new_coding)
  return data 

方法三:

import cchardet
def convert_encoding3(data,new_coding='UTF-8'):
  encoding = cchardet.detect(data)['encoding']
  if new_coding.upper() != encoding.upper():
    data  = data.decode(encoding,data).encode(new_coding)
  return data 

使用方法:

此處使用方法一

#轉換成utf-8
convert_encoding(data,'utf-8')

#轉抱成GBK  
convert_encoding(data,'gbk')

#轉抱成GB2312
convert_encoding(data,'gbk')
向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

凯里市| 德兴市| 阳曲县| 宿松县| 松阳县| 如皋市| 特克斯县| 双鸭山市| 大田县| 息烽县| 临江市| 个旧市| 东光县| 咸丰县| 紫阳县| 灵璧县| 天柱县| 子长县| 大兴区| 金华市| 古田县| 寻乌县| 开封县| 沅江市| 邓州市| 连江县| 金寨县| 莱西市| 淮安市| 湘西| 手游| 青铜峡市| 哈巴河县| 双柏县| 上犹县| 河西区| 濮阳县| 沙河市| 通山县| 盐山县| 龙南县|