Python字符串编码

2023-11-14 23:55:27

在Python中,字符串可以使用不同的编码方式进行表示和处理。Python 3默认使用UTF-8编码,而Python 2默认使用ASCII编码。

在Python中,可以使用`encode()`方法将字符串编码为指定的编码方式,例如:

s = "你好"
encoded_s = s.encode("utf-8")
print(encoded_s)  # b'xe4xbdxa0xe5xa5xbd'

在上述代码中,将字符串`s`使用UTF-8编码方式编码为字节序列`b'xe4xbdxa0xe5xa5xbd'`。

同样地,可以使用`decode()`方法将字节序列解码为字符串,例如:

encoded_s = b'xe4xbdxa0xe5xa5xbd'
decoded_s = encoded_s.decode("utf-8")
print(decoded_s)  # 你好

在上述代码中,将字节序列`b'xe4xbdxa0xe5xa5xbd'`使用UTF-8编码方式解码为字符串`你好`。

需要注意的是,在使用不同的编码方式进行字符串编码和解码时,需要确保编码方式是一致的,否则会出现乱码或解码错误的情况。