您的当前位置:首页正文

python中字符编码是什么?如何转换字符?

2024-08-01 来源:伴沃教育

屏幕前我们看到的文字,在计算机中也是这样表示吗?事实上,我们所有的信息电脑是无法直接理解的,同样我们所要表达的信息,计算机也不能看懂。这就需要架起一个理解的桥梁,也就是编码帮助我们相互之间进行翻译。今天小编就python中的字符编码问题为带来讲解,同时教大家转换字符的方法。

字符编码(Character Encoding)是将字符集中的字符码映射为字节流的一种具体实现方案,常见的字符编码有 ASCII 编码、UTF-8 编码、GBK 编码等。某种意义上来说,字符集与字符编码有种对应关系,例如 ASCII 字符集对应 有 ASCII 编码。ASCII 字符编码规定使用单字节中低位的7个比特去编码所有的字符。例如"A" 的编号是65,用单字节表示就是0×41,因此写入存储设备的时候就是b'01000001'。

在最新的 Python 3 版本中,所有字符串都以Unicode 进行编码。因此,Python3 的字符串默认支持多语言。声明字符串可以使用单引号和双引号

>>> a = "apple"
>>> b = 'banana'
>>> print('包含中文的str')
包含中文的str

对于单个字符的编码,Python提供了 ord() 函数获取字符的十进制整数表示,chr() 函数把编码转换为对应的字符:

>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'

如果知道字符的整数编码,还可以用十六进制写 str,两种写法完全是等价的。

>>> '\u4e2d\u6587'
'中文'
>>> '\u4e2d\u6587' == '中文'
True


通过字符编码,我们就可以对计算机的数据进行转换,当然也可以把我们的数据转换成计算机机语言保存起来,觉得实用的小伙伴赶紧学起来吧。

显示全文