第六节，初识python和字符编码

时间 2019-11-12

标签第六 python 字符编码栏目 Python 繁體版

原文原文链接

程序语言的发展php

　　机器语言html

　　程序语言，最初的计算机语言是机器语言，彻底是0和1组成的二进制串java

　　如：01010101python

　　　　 11010101linux

　　汇编语言c#

　　由于01010101的字符串，冗长，不利于维护，因此产生了带助记符的汇编语言windows

　　举例：fua = 01010101网络

　　　　 fub = 11010101运维

　　c语言python2.7

　　在汇编的基础上开发了c语言

　　有了常量，变量，字符串，等运算规则

　　java、c#、php、python

　　在c语言的基础长有发展了java、c#、php、python 等各类语言

　　这些语言都须要安装运行环境，也能够理解成软件，

叫卖录音网
 录音网站大全

Python前世此生

python的创始人为吉多·范罗苏姆（Guido van Rossum）。1989年的圣诞节期间，吉多·范罗苏姆为了在阿姆斯特丹打发时间，决心开发一个新的脚本解释程序，做为ABC语言的一种继承。

Python能够应用于众多领域，如：数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎全部大中型互联网企业都在使用Python，如：Youtube、Dropbox、BT、Quora（中国知乎）、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。互联网公司普遍使用Python来作的事通常有：自动化运维、自动化测试、大数据分析、爬虫、Web 等。

注视：上述重点字体表示该公司主要使用Python语言开发

为何是Python而不是其余语言？

C 和 Python、Java、C#等

C语言：代码编译获得机器码，机器码在处理器上直接执行，每一条指令控制CPU工做

其余语言：代码编译获得字节码，虚拟机执行字节码并转换成机器码再后在处理器上执行

Python 和 C Python这门语言是由C开发而来

　　对于使用：Python的类库齐全而且使用简洁，若是要实现一样的功能，Python 10行代码能够解决，C可能就须要100行甚至更多.
　　对于速度：Python的运行速度相较与C，绝逼是慢了

Python 和 Java、C#等

　　对于使用：Linux原装Python，其余语言没有；以上几门语言都有很是丰富的类库支持
　　对于速度：Python在速度上可能稍显逊色

因此，Python和其余语言没有什么本质区别，其余区别在于：擅长某领域、人才丰富、先入为主。

Python的种类

Cpython
Python的官方版本，使用C语言实现，使用最为普遍，CPython实现会将源文件（py文件）转换成字节码文件（pyc文件），而后运行在Python虚拟机上。
Jyhton
Python的Java实现，Jython会将Python代码动态编译成Java字节码，而后在JVM上运行。
IronPython
Python的C#实现，IronPython将Python代码编译成C#字节码，而后在CLR上运行。（与Jython相似）
PyPy（特殊）
Python实现的Python，将Python的字节码字节码再编译成机器码。
RubyPython、Brython ...

以上除PyPy以外，其余的Python的对应关系和执行流程以下：

Python环境

安装Python

　　windows：

　　一、下载安装包 https://www.python.org/downloads/

　　二、安装默认安装路径：C:\python27

　　三、配置环境变量【右键计算机】--》【属性】--》【高级系统设置】--》【高级】--》【环境变量】--》【在第二个内容框中找到变量名为Path 的一行，双击】 --> 【Python安装目录追加到变值值中，用；分割】如：原来的值;C:\python27，切记前面有分号

　　linux：

　　无需安装，原装Python环境 ps：若是自带2.6，请更新至2.7 更新Python

　　windows:

　　卸载重装便可

　　linux:

　　Linux的yum依赖自带Python，为防止错误，此处更新其实就是再安装一个Python

　　查看默认Python版本 python -V

　　一、安装gcc，用于编译Python源码 yum install gcc

　　二、下载源码包，https://www.python.org/ftp/python/

　　三、解压并进入源码文件

　　四、编译安装 ./configure make all make install

　　五、查看版本 /usr/local/bin/python2.7 -V

　　六、修改默认Python版本 mv /usr/bin/python /usr/bin/python2.6 ln -s /usr/local/bin/python2.7 /usr/bin/python

　　七、防止yum执行异常，修改yum使用的Python版本 vi /usr/bin/yum 将头部 #!/usr/bin/python 修改成 #!/usr/bin/python2.6

Python入门

　　Python的运行方式

　　终端运行方式：

　　打开Python终端，输入print "ni hao"

　　>>> print "ni hao"　　　　　　回车
　　ni hao

　　这样就将ni hao打印出来了

　　文件运行方式：

　　用编辑器将 print "ni hao" 写入编辑器，保存成Python文件，以.py 后缀方式保存

　　打开终端不启动Python 输入Python 文件路径如：I:\py\1\n.py 回车执行

　　这样就执行了n.py并把文件内容读出来了

　　二者之间的区别，终端执行是执行一次关闭终端后不保留代码，文件执行是能够屡次执行，而且代码写入了.py文件里

　　注意：Python2.7和3.5的函数区别如：print函数

　　2.7 print "ni hao"

　　3.5 print ("ni hao")

　　两个版本之间在函数的书写格式上，3.5必须加括号() 2.7 能够加括号() 也能够不加

Python解释器

　　能够理解为解释代码或者代码文件的软件

　　上面能够看到咱们在终端里输入了 Python I:\py\1\n.py 这样就是说告诉了系统用Python解释器，解释I:\py\1\n.py这个文件

　　若是想要访问文件时自动执行python解释器，例输入： ./n.py ，那么就须要在 n.py文件的头部指定解释器

　　若是须要解释器自动执行一种字符编码方式解释，也须要在头部指定字符编码

　　如　

　　这样当系统访问文件时，就告诉了系统，我这个文件须要Python解释器解释而且以utf-8的编码

　　假如这个文件在根目录下，如此一来，执行： ./n.py 便可。

　　注意：执行前需给予 n.py 执行权限，chmod 755 n.py

内容编码

字符编码的发展

　　 ascii (只能识别英文)

　　8位 = 01010101 2**8（2的8次方）= 256 种组合就能够表示全部的英文，字符，数字

　　也就是1个字节就能表示全部的英文，字符，数字

　　可是不能表示其余国家语言如中文

　　万国码 unicode （包含任何国家语言）

　　最少用2个字节来表示：

　　1个字节 = 8位 = 01010101

　　2个字节 = 16位 = 0101010101010101 2个字节就是 2**16（2的16次方）= 65536 种组合

　　也就是说万国码最少也要用两个字节来表示

　　中文是用3个字节来表示的

　　3个字节 = 24位 = 010101010101010101010101 3个字节就是 2**24（2的24次方）= 16777216 种组合

　　utf-8

　　有了万国码后人们又发现，形成了运算空间的浪费，明明能够用1个字节表示的也用了2个字节来表示，后来就又发明了utf-8

　　utf-8 是在万国码的基础上进行了加工

　　也就是utf-8会自动根据地区语言来判断用多少位识别

　　英文：8位

　　欧洲：16位

　　中文：24位

　　...

因此咱们在写Python文件是要是有中文汉字，就须要告诉解释器用什么编码

　　如：　

1 #!/usr/bin/env python
2 # -*- coding: utf-8 -*-
3 print '你好 中国'

若是是Python3.5版本解释器，就能够不加编码，由于默认就是utf-8编码

也就是说，解释器默认是utf-8就能够不加，若是默认不是utf-8就必须加才能识别中文

编码和解码

　　编码和解码流程图

　　utf-8或者gbk等编码都是，由万国码编码而来的这个过程叫作（编码），将utf-8在还原成万国码这个过程叫作（解码）

　　在python中能够将某一段字符进行编码或者解码

　　decode() 函数为解码函数值：为要解码的编码（本来编码）

　　　　使用方法：要解码的字符串变量.decode(要解码的编码)

　　　　如：jiem = zifu.decode("utf-8")

　　encode()　函数为编码函数值：为要编的码（编码）

　　　　使用方法：要编码的解码变量.decode(要编的码)

举例：

1 #!/usr/bin/env python
2 # -*- coding: utf-8 -*-
3 zifu = "中文字符"
4 #解码，须要指定原来的是什么编码
5 jiem = zifu.decode("utf-8")
6 #编码，须要指定要使用什么编码
7 bianm = jiem.encode("gbk")
8 print(bianm)

　　注意：若是是python3.5或者以上版本，能够省略解码的环境，直接第二步从新编码就能够，也就是能够直接将utf-8直接编码成gbk，（解码的过程解释器会自动完成）