1、说明
UTF-8编码,即“可变长的编码”。
UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,很生僻的字符会被编码成4-6个字节。
2、注意点
Python的诞生比Unicode标准早,所以最早的Python只支持ASCII代码。
一般字符串ABC在Python中都是ASCII编码。
使用UTF-8代码还有另一个好处,那就是ASCII代码实际上可以被视为UTF-8代码的一部分。
因此,大量只支持ASCII代码的历史遗留软件可以在UTF-8代码下继续工作。
这就是为什么我们每次使用中文都需要在文件开头声明UTF-8。
以上就是python UTF-8编码的介绍,希望对大家有所帮助。更多Python学习指路:Python基础教程