您好,登錄后才能下訂單哦!
小編給大家分享一下Python字符編碼的簡介,相信大部分人都還不怎么了解,因此分享這篇文章給大家學習,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學習方法吧!
Python 字符編碼簡記
可以簡單的理解為:
1.為了處理英文字符,產生了ASCII碼。
2.為了處理中文字符,產生了GB2312。
3.為了處理各國字符,產生了Unicode。
4.為了提高Unicode存儲和傳輸性能,產生了UTF-8,它是Unicode的一種實現形式。
注意:
Python2.x 默認編碼是 ASCII
Python3.x 默認編碼是 unicode,所以 Python3.x 直接支持中文不需要進行二次處理。
GBK轉換成 UTF-8 的流程:
1.通過解碼 (decode) 轉換成 Unicode
2.通過編碼 (encode) 轉成成 GBK
亂碼是因為系統編碼與所提供字符的編碼不一致所導致的。所以當我們需要操作系統正確的輸出一個字符時,除了要知道該字符的字符編碼,也要知道自己系統所使用的字符編碼。
Linux 系統大部分使用的是 UTF-8 編碼,Windoors 系統使用的編碼是 GB2312。
可以通過 chardet 來判斷字符的編碼
安裝步驟:
1. 下載 chardet-3.0.4.tar.gz 地址:https://pypi.python.org/pypi/chardet/3.0.4#downloads 2. 解壓至安裝目錄 我的電腦為 D:\software\Python2.7\Lib\site-packages\chardet-3.0.4 3. 打開 Windows 命令行窗口進行安裝
進入源碼目錄
使用 python setup.py install 安裝
測試
# -*- encoding:utf-8 -*- import chardet name = '你好' print(chardet.detect(name))
運行結果:
在py2中
#-*- coding: UTF-8 -*-
聲明這句話就是告訴 python2.7 解釋器 (默認ACSII編碼方式)解釋的 .py 文件聲明下面的內容按 utf8 編碼,就是編碼(編碼成字節串最后轉成0101的形式讓機器去執行)
以上是Python字符編碼的簡介的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。