中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中出現文本亂碼如何解決

發布時間:2021-07-10 15:40:29 來源:億速云 閱讀:119 作者:Leah 欄目:編程語言

今天就跟大家聊聊有關Python中出現文本亂碼如何解決,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

在處理utf8文本格式的時候,由于這些文本是含BOM(byte order mark)的utf8文本,編譯時產生一個Error,”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原來,某些軟件,如notepad,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。 因此我們在讀取時需要自己去掉這些字符,Python中的codecs module定義了這個常量:

查看源代碼打印幫助

import codecs   data = open("Test.txt").read()   if data[:3] == codecs.BOM_UTF8:   datadata = data[3:]   print data.decode("utf-8")

看完上述內容,你們對Python中出現文本亂碼如何解決有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

公安县| 九寨沟县| 巢湖市| 易门县| 巴林左旗| 武清区| 四会市| 东辽县| 手机| 蒙山县| 微博| 慈利县| 盘锦市| 衡东县| 城固县| 松桃| 西乌珠穆沁旗| 嘉定区| 连南| 乌拉特中旗| 巫溪县| 呼伦贝尔市| 伊金霍洛旗| 十堰市| 桑日县| 西乌珠穆沁旗| 白朗县| 佛学| 黔西| 镇坪县| 荣昌县| 宁化县| 赣榆县| 彰化市| 西昌市| 河源市| 临颍县| 龙胜| 扶绥县| 文水县| 贵阳市|