036 字符编码

时间 2019-11-20

标签字符编码栏目字符编码繁體版

原文原文链接

字符编码

1.计算机基础

1.cpu ：控制程序的运行（从内存中取出文本编辑器的数据读入内存）python

2.内存：运行程序（通过cpu操做后，内存中含有文本编辑器的数据）windows

3.硬盘：存储数据（文本编辑器）编辑器

应用程序的任何操做硬件的请求都须要向操做系统发起系统调用，而后由操做系统取操做硬件编码

2.文本编辑器

计算机只认识 0和1操作系统

文本编辑器的做用：读写数据，保存数据code

打开文本编辑器就时启动了一个进程，是在内存中的，因此，用编辑器编写的内容也都是存放与内存中的，断电后数据就会丢失。
要想永久保存，须要保存文件，把编辑器在内存的数据就存到了到了硬盘上。
在咱们编写一个pyrthon的py文件没有执行时，跟编写其余文件没有任何区别，都只是在编写一堆字符而已。

python解释器具备文本编辑器的功能进程

3.字符编码

1.在早期咱们不一样的国家都是用不一样的编码格式来使用计算机，编写文件以及使用文件的。那最开始咱们每一个国家用着不一样的编码，也就是说每一个国家的编码时不能够相互转换的，也就是若是只用一个国家的编码的话，那日他国家的编码在文字解析的时候就会出现乱码。因此就出现了一种可以认识全世界的语言，也就是它可以解析任何一个国家编码格式的文字，这种语言就是Unicode内存

2.咱们的文件最开始都是以不一样的编码格式存在硬盘中的，当咱们须要一个任何格式编码的文件的数据时，咱们并非直接就能把它打开并读取到文件中的数据的，咱们须要把这个文件先放到内存中去而后用可以认识全世界语言的Unicode去解析这个文件。unicode

3.可是因为unicode在解析文件以后进行文件在硬盘存储的时候，它会浪费大量的时间和内存空间，那这个时候有出现了一个基于unicode的可变长编码UTF8，咱们把unicode形式编码在转换成UTF8形式的编码，可是UTF8时只认识unicode编码的，咱们不能够直接的将咱们索要读取的文件直接用UTF8去解析，不然也会出现乱码。字符编码

4.何时会乱码

1.编码格式不统一的时候

2.文件编辑器只认识一种固定的编码格式，你却用另外一种编码格式输入数据的时候。--文件的存储

3.文件存储的时候用的是一种固定的编码格式，可是你却用另外一种编码格式打开。--文件的读取

5.如何解决乱码

什么格式存储，就什么格式读取，就不会出现乱码的状况

windows电脑的记事本文件默认为gbk编码，除此以外都是utf8格式