036 字符编码

字符编码

1.计算机基础

1.cpu :控制程序的运行(从内存中取出文本编辑器的数据读入内存)python

2.内存:运行程序(通过cpu操做后,内存中含有文本编辑器的数据)windows

3.硬盘:存储数据(文本编辑器)编辑器

应用程序的任何操做硬件的请求都须要向操做系统发起系统调用,而后由操做系统取操做硬件编码

2.文本编辑器

计算机只认识 0和1操作系统

文本编辑器的做用:读写数据,保存数据code

  1. 打开文本编辑器就时启动了一个进程,是在内存中的,因此,用编辑器编写的内容也都是存放与内存中的,断电后数据就会丢失。
  2. 要想永久保存,须要保存文件,把编辑器在内存的数据就存到了到了硬盘上。
  3. 在咱们编写一个pyrthon的py文件没有执行时,跟编写其余文件没有任何区别,都只是在编写一堆字符而已。

python解释器具备文本编辑器的功能进程

3.字符编码

1.在早期咱们不一样的国家都是用不一样的编码格式来使用计算机,编写文件以及使用文件的。那最开始咱们每一个国家用着不一样的编码,也就是说每一个国家的编码时不能够相互转换的,也就是若是只用一个国家的编码的话,那日他国家的编码在文字解析的时候就会出现乱码。因此就出现了一种可以认识全世界的语言,也就是它可以解析任何一个国家编码格式的文字,这种语言就是Unicode内存

2.咱们的文件最开始都是以不一样的编码格式存在硬盘中的,当咱们须要一个任何格式编码的文件的数据时,咱们并非直接就能把它打开并读取到文件中的数据的,咱们须要把这个文件先放到内存中去而后用可以认识全世界语言的Unicode去解析这个文件。unicode

3.可是因为unicode在解析文件以后进行文件在硬盘存储的时候,它会浪费大量的时间和内存空间,那这个时候有出现了一个基于unicode的可变长编码UTF8,咱们把unicode形式编码在转换成UTF8形式的编码,可是UTF8时只认识unicode编码的,咱们不能够直接的将咱们索要读取的文件直接用UTF8去解析,不然也会出现乱码。字符编码

4.何时会乱码

1.编码格式不统一的时候

2.文件编辑器只认识一种固定的编码格式,你却用另外一种编码格式输入数据的时候。--文件的存储

3.文件存储的时候用的是一种固定的编码格式,可是你却用另外一种编码格式打开。--文件的读取

5.如何解决乱码

什么格式存储,就什么格式读取,就不会出现乱码的状况

windows电脑的记事本文件默认为gbk编码,除此以外都是utf8格式

相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息