字符编码问题

时间 2019-11-17

标签字符编码问题栏目字符编码繁體版

原文原文链接

题干为：有以下字符串：n = "齐天大圣"。编码

要求：（1）将字符串转换成utf-8的字符编码的字节，再将转换的字节从新转换为utf-8的字符编码的字符串spa

　　　（2）将字符串转换成utf-8的字符编码的字节，再将转换的字节从新转换为gbk的字符编码的字符串code

　　（1）对于第一个问题，将字符串编码为utf-8编码的字节，而后再转为utf-8，这里能够直接进行encode与decode的操做：blog

　　这里咱们给n赋值为'齐天大圣'，将n的值以utf-8的方式编码获得的结果赋值给n2，而一样以utf-8的方式解码获得的结果仍然是'齐天大圣'，也就是说此时的n3与n相等。utf-8

　　（2）可是对于以utf-8方式编码，而又以gbk方式解码，对于不少初学者来讲可能会犯下面这样的错误，不少人可能按照字面的意思会这样写：字符串

n = '齐天大圣'
n2 = n.encode('utf-8')
n3 = n2.decode('gbk')
print('编码：%s\n解码：%s\n' % (n2,n3))

　　可是，输出的结果倒是这样子的：字符编码

　　解码的结果居然出现了乱码！！！class

　　这里须要着重强调一下，当咱们将字符串先以utf-8的编码形式写进计算机的硬盘上时，也就至关于给这个字符串上了一把“锁”，而打开这把“锁”的“钥匙”是在你“上锁”的时候就惟一肯定了的。也就是说，当你用utf-8的编码模式encode的时候，decode的话必须以一样的编码方式进行，而上图中咱们先以utf-8的模式对字符串“上锁”，而gbk方式不是合适的“钥匙”，当你用这个“不合适的钥匙”解锁的时候，计算机不知道你究竟要decode什么，因此固然会出现乱码。乱码

　　问题（2）正确的解决方式须要咱们先将用utf-8模式编码好的字符串以utf-8的模式decode出来，再进行gbk模式的编解码操做：im

n = '齐天大圣'
n2 = n.encode('utf-8')
n3 = n2.decode('utf-8')
n4 = n3.encode('gbk')
n5 = n4.decode('gbk')
print('utf-8编码字节为：%s\ngbk解码字符串为：%s' % (n2,n5))

1. Python 字符编码问题
2. Python字符编码问题
3. 字符编码问题
4. python：字符编码问题
5. 字符编码问题mysql
6. python 字符编码问题
7. 字符的编码问题
8. Python3 字符编码问题
9. MySQL字符编码问题
10. 【编码】字符编码问题
更多相关文章...
• XML 编码 - XML 教程
• R 字符串 - R 语言教程
• PHP Ajax 跨域问题最佳解决方案
• IntelliJ IDEA中SpringBoot properties文件不能自动提示问题解决