要查看Python字符串的編碼,可以使用字符串對象的encode()
方法。該方法將字符串編碼為指定的編碼格式,并返回一個字節數組。可以使用decode()
方法將字節數組解碼為字符串。
以下是一個示例:
str = "你好"
encoded_str = str.encode("utf-8")
print(encoded_str) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
decoded_str = encoded_str.decode("utf-8")
print(decoded_str) # 你好
在上述示例中,str
是一個包含中文字符的字符串。使用encode()
方法將其編碼為UTF-8格式。編碼后的字符串為b'\xe4\xbd\xa0\xe5\xa5\xbd'
,其中\x
表示十六進制值。然后使用decode()
方法將字節數組解碼為字符串,并獲得原始的中文字符串。
要查看字符串的當前編碼格式,可以使用sys.getdefaultencoding()
函數。該函數返回Python解釋器當前默認的字符串編碼格式。
import sys
print(sys.getdefaultencoding()) # utf-8
上述示例中,sys.getdefaultencoding()
函數返回的是UTF-8編碼格式。