Python中出現文本亂碼如何解決

發布時間：2021-07-10 15:40:29 來源：億速云閱讀：119 作者：Leah 欄目：編程語言

今天就跟大家聊聊有關Python中出現文本亂碼如何解決，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結了以下內容，希望大家根據這篇文章可以有所收獲。

在處理utf8文本格式的時候，由于這些文本是含BOM(byte order mark)的utf8文本，編譯時產生一個Error，”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原來，某些軟件，如notepad，在保存一個以UTF-8編碼的文件時，會在文件開始的地方插入三個不可見的字符（0xEF 0xBB 0xBF，即BOM）。因此我們在讀取時需要自己去掉這些字符，Python中的codecs module定義了這個常量：

查看源代碼打印幫助

import codecs   data = open("Test.txt").read()   if data[:3] == codecs.BOM_UTF8:   datadata = data[3:]   print data.decode("utf-8")

看完上述內容，你們對Python中出現文本亂碼如何解決有進一步的了解嗎？如果還想了解更多知識或者相關內容，請關注億速云行業資訊頻道，感謝大家的支持。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python中出現文本亂碼如何解決

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python中出現文本亂碼如何解決

猜你喜歡

最新資訊

相關推薦

相關標簽