中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在Python中使用中文

發布時間:2021-12-01 14:12:39 來源:億速云 閱讀:546 作者:iii 欄目:編程語言

這篇文章主要講解了“怎么在Python中使用中文”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么在Python中使用中文”吧!

在Python中使用中文

它有兩種默認的字符串:str和unicode。用它一定要注意區分“Unicode字符串”和“unicode對象”的區別。后面所有的“unicode字符串”指的都是python里的“unicode對象”。
事實上在Python并沒有“Unicode字符串”這樣的東西,只有“unicode”對象。一個傳統意義上的unicode字符串完全可以用str對象表示。只是這時候它僅僅是一個字節流,除非解碼為unicode對象,沒有任何實際的意義。

我們用“哈哈”在多個平臺上測試,其中“哈”對應的不同編碼是:

1. UNICODE (UTF8-16), C854;  2. UTF-8, E59388;  3. GBK, B9FE。

Windows控制臺

下面是在windows控制臺的運行結果:

可以看出在控制臺,中文字符的編碼是GBK而不是UTF-16。將字符串s(GBK編碼)使用decode進行解碼后,可以得到同等的unicode對象。
注意:可以在控制臺打印ss并不代表它可以直接被序列化,比如:

向文件直接輸出ss會拋出同樣的異常。在處理unicode中文字符串的時候,必須首先對它調用encode函數,轉換成其它編碼輸出。這一點對各個環境都一樣。
總結:在Python中,“str”對象就是一個字節數組,至于里面的內容是不是一個合法的字符串,以及這個字符串采用什么編碼(gbk, utf-8, unicode)都不重要。

這些內容需要用戶自己記錄和判斷。這些的限制也同樣適用于“unicode”對象。要記住“unicode”對象中的內容可絕對不一定就是合法的unicode字符串,我們很快就會看到這種情況。
總結:在windows的控制臺上,支持gbk編碼的str對象和unicode編碼的unicode對象。

  • 淺析Python中的Python全局變量

  • 有關Python中文問題進行詳細說明

  • Python中文字符具體應用技巧分享

  • Python中文對相關文件的改編和處理

  • Python中文如何進行語言轉換

Windows IDLE(在Shell上運行)

在windows下的IDLE中,運行效果和windows控制臺不完全一致:

可以看出,對于不使用“u”作標識的字符串,IDLE把其中的中文字符進行GBK編碼。但是對于使用“u”的unicode字符串,IDLE居然一樣是用了GBK編碼,不同的是,這時候每一個字符都是unicode(對象)字符!!此時len(ss) = 4。這樣產生了一個神奇的問題,現在的ss無法在IDLE中正常顯示。而且我也沒有辦法把ss轉換成正常的編碼!

比如采用下面的方法:

這有可能是因為IDLE本地化做得不夠好,對中文的支持有問題。建議在IDLE的SHELL中,不要使用u“中文”這種方式,因為這樣得到的并不是你想要的東西。
這同時說明IDLE的Shell支持兩種格式的中文字符串:GBK編碼的“str”對象,和UNICODE編碼的unicode對象。

感謝各位的閱讀,以上就是“怎么在Python中使用中文”的內容了,經過本文的學習后,相信大家對怎么在Python中使用中文這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

武平县| 四子王旗| 墨脱县| 运城市| 平邑县| 府谷县| 克山县| 来安县| 玉环县| 双鸭山市| 基隆市| 迁西县| 鞍山市| 连江县| 汾西县| 收藏| 黄石市| 黑龙江省| 静海县| 古蔺县| 金华市| 隆德县| 兰考县| 化隆| 南康市| 怀来县| 北流市| 大港区| 白城市| 大同市| 秭归县| 伊宁县| 双江| 乌兰浩特市| 固阳县| 兴国县| 栖霞市| 平顶山市| 曲阜市| 新建县| 浦东新区|