python的起源

时间 2019-11-11

标签 python 起源栏目 Python 繁體版

原文原文链接

Python简介及入门

编程语言简介
Python介绍
Python安装
pycharm安装
中文编码

1.编程语言简介

编程语言概念

　　编程语言（programming language），是用来定义计算机程序的形式语言。它是一种被标准化的交流技巧，用来向计算机发出指令。一种计算机语言让程序员可以准确地定义计算机所须要使用的数据，并精确地定义在不一样状况下所应当采起的行动。python

编程语言的类别

　　编程语言分为机器语言，汇编语言以及高级语言，通常咱们将机器语言、汇编语言这样的偏向底层设计的统称为低级语言，低级语言并非说功能少，而是编程起来相对于高级语言来讲太麻烦了。程序员

　　高级语言的表明有：Python、Java、PHP、C#·····等等；编程

　　低级语言的表明有：汇编、C······等等；网络

　　编程语言也能够分为编译型语言和解释型语言：框架

　　编译型语言：编译器是把源程序的每一条语句都编译成机器语言，并保存成二进制文件，这样运行时计算机能够直接以机器语言来运行此程序，速度很快；运维

解释型语言：解释器则是只在执行程序时，才一条一条的解释成机器语言给计算机来执行，因此运行速度是不如编译后的程序运行的快的；编程语言

固然还有其它的，好比静态语言和动态语言，强类型定义语言和弱类型定义语言。工具

　　编译型VS解释型性能

编译型单元测试

优势：编译器通常会有预编译的过程对代码进行优化。由于编译只作一次，运行时不须要编译，因此编译型语言的程序执行效率高，能够脱离语言环境独立运行。

缺点：编译以后若是须要修改就须要整个模块从新编译。编译的时候根据对应的运行环境生成机器码，不一样的操做系统之间移植就会有问题，须要根据运行的操做系统环境编译不一样的可执行文件。

解释型

优势：有良好的平台兼容性，在任何环境中均可以运行，前提是安装了解释器，灵活，修改代码的时候直接修改就行，能够快速部署，不用中止维护。

缺点：每次运行的时候都要解释一遍，性能上不如编译型语言。

高级语言和低级语言的优缺点

　　高级语言，优势：开发快，缺点：执行效率低，须要将代码转化成字节码，而后将字节码再编译成机器码供计算机识别执行；

　　低级语言，优势：执行效率高，缺点：开发慢，不放变编写，编写后的代码可直接供计算机识别执行；

机器码和字节码介绍

　　机器码：

　　学名机器语言指令，有时也被称为原生码（Native Code），是电脑的CPU可直接解读的数据。一般意义上来理解的话，机器码就是计算机能够直接执行，而且执行速度最快的代码，用机器语言编写程序，编程人员要首先熟记所用计算机的所有指令代码和代码的涵义。手编程序时，程序员得本身处理每条指令和每一数据的存储分配和输入输出，还得记住编程过程当中每步所使用的工做单元处在何种状态。这是一件十分繁琐的工做，编写程序花费的时间每每是实际运行时间的几十倍或几百倍。并且，编出的程序全是些0和1的指令代码，直观性差，还容易出错。

　　整体来讲，机器码是电脑CPU直接读取运行的机器指令，运行速度最快，可是很是晦涩难懂，也比较难编写，通常从业人员接触不到。

　　字节码：

　　字节码（Bytecode）是一种包含执行程序、由一序列 op 代码/数据对组成的二进制文件。字节码是一种中间码，它比机器码更抽象，须要直译器转译后才能成为机器码的中间代码。一般状况下它是已经通过编译，但与特定机器码无关。字节码一般不像源码同样可让人阅读，而是编码后的数值常量、引用、指令等构成的序列。字节码主要为了实现特定软件运行和软件环境、与硬件环境无关。字节码的实现方式是经过编译器和虚拟机器。编译器将源码编译成字节码，特定平台上的虚拟机器将字节码转译为能够直接执行的指令。

　　整体来讲，字节码是一种中间状态（中间码）的二进制代码（文件）。须要直译器转译后才能成为机器码。

　　高级语言生成的是字节码，再由各语言的编译器进行编译后转成机器码供计算机执行。

　　低级语言生成的是机器码，可直接由计算机执行。

编码介绍

　　编码是信息从一种形式或格式转换为另外一种形式的过程也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码，或将信息、数据转换成规定的电脉冲信号。

　　种类：

　　ASCII、Unicode、utf八、gbk等等；

　　a.ASCII

　　目前计算机中用得最普遍的字符集及其编码，是由美国国家标准局(ANSI)制定的ASCII码。适用于全部拉丁文字字母，ASCII码有7位码和8位码两种形式。

　　咱们知道，在计算机内部，全部的信息最终都表示为一个二进制的字符串。每个二进制位（bit）有0和1两种状态，所以八个二进制位就能够组合出256种状态，这被称为一个字节（byte）。也就是说，一个字节一共能够用来表示256种不一样的状态，每个状态对应一个符号，就是256个符号，从 0000000到11111111。

　　ASCII码一共规定了128个字符的编码，这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的1位统一规定为0。

　　缺点：英语用128个符号编码就够了，可是用来表示其余语言，128个符号是不够的。好比，在法语中，字母上方有注音符号，它就没法用ASCII码表示。因而，一些欧洲国家就决定，利用字节中闲置的最高位编入新的符号。好比，法语中的é的编码为130（二进制10000010）。这样一来，这些欧洲国家使用的编码体系，能够表示最多256个符号。可是，这里又出现了新的问题。不一样的国家有不一样的字母，所以，哪怕它们都使用256个符号的编码方式，表明的字母却不同。好比，130在法语编码中表明了 é，在希伯来语编码中却表明了字母Gimel (?)，在俄语编码中又会表明另外一个符号。可是无论怎样，全部这些编码方式中，0—127表示的符号是同样的，不同的只是128—255的这一段。至于亚洲国家的文字，使用的符号就更多了，汉字就多达10万左右。一个字节只能表示256种符号，确定是不够的，就必须使用多个字节表达一个符号。好比，简体中文常见的编码方式是GB2312，使用两个字节表示一个汉字，因此理论上最多能够表示256x256=65536个符号。

　　b.Unicode

　　世界上存在着多种编码方式，同一个二进制数字能够被解释成不一样的符号。所以，要想打开一个文本文件，就必须知道它的编码方式，不然用错误的编码方式解读，就会出现乱码。为何电子邮件常常出现乱码？就是由于发信人和收信人使用的编码方式不同。

　　能够想象，假若有一种编码，将世界上全部的符号都归入其中。每个符号都给予一个独一无二的编码，那么乱码问题就会消失。这就是Unicode，就像它的名字都表示的，这是一种全部符号的编码。

　　缺点：浪费内存；咱们已经知道，英文字母只用一个字节表示就够了，假如unicode统一规定，每一个符号用三个或四个字节表示，那么每一个英文字母前都必然有二到三个字节是0，这对于存储来讲是极大的浪费，文本文件的大小会所以大出二三倍，这是没法接受的。

　　c.utf8

　　UTF-8就是在互联网上使用最广的一种unicode的实现方式。UTF-8最大的一个特色，就是它是一种变长的编码方式。它可使用1~4个字节表示一个符号，根据不一样的符号而变化字节长度。

　　UTF-8的编码规则很简单，只有二条：

　　1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。所以对于英语字母，UTF-8编码和ASCII码是相同的。

　　2）对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一概设为10。剩下的没有说起的二进制位，所有为这个符号的unicode码。

　　d.gbk

　　GBK是中国国家编码，通用性比UTF8差，不过UTF8占用的空间比GBK大。

　　UTF8是国际编码，它的通用性比较好，外国人也能够浏览论坛，并且中文能够直接识别，假如你的论坛要作的比较国际化那就必须用UTF8。

2.Python介绍

Python由来

　　Python的创始人为Guido van Rossum。1989年圣诞节期间，在阿萨姆特丹，Guido为了打发圣诞节的无趣，决心开发一个新的脚本解释程序，做为ABC 语言的一种继承。之因此选中Python（大蟒蛇的意思）做为该编程语言的名字，是由于他是一个叫Monty Python的喜剧团体的爱好者。

　　Python能够应用于众多领域，如：数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎全部大中型互联网企业都在使用Python，如：Youtube、Dropbox、BT、Quora（中国知乎）、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。互联网公司普遍使用Python来作的事通常有：自动化运维、自动化测试、大数据分析、爬虫、Web 等。

Python和其余语言区别

　　大多数高级语言都是在C语言的基础上开发的，好比Python、Java、C#......等等；

　　C vs Python、Java、C#等等：

　　C语言：代码编译获得机器码，机器码在处理器上直接执行，每一条指令控制CPU工做；

　　其余语言：代码编译获得字节码，虚拟机执行字节码并转换成机器码再后在处理器上执行；

　　Python也称C Python由C语言开发而来：

　　对于使用：Python的类库齐全而且使用简洁，若是要实现一样的功能，Python 10行代码能够解决，C可能就须要100行甚至更多.
　　对于速度：Python的运行速度相较与C，比较慢，没有C执行的快；

　　Python vs Java、C#等等：

　　对于使用：Linux原装Python，其余语言没有；以上几门语言都有很是丰富的类库支持；
　　对于速度：Python在速度上可能稍显逊色；

Python种类

CPython
Python的官方版本，使用C语言实现，使用最为普遍，CPython实现会将源文件（py文件）转换成字节码文件（pyc文件），而后运行在Python虚拟机上。
JPyhton
Python的Java实现，Jython会将Python代码动态编译成Java字节码，而后在JVM上运行。
IronPython
Python的C#实现，IronPython将Python代码编译成C#字节码，而后在CLR上运行。（与Jython相似）
PyPy（特殊）
Python实现的Python，将Python的代码转换字节码再编译成机器码。优势，在第二次执行代码是则直接将代码转换成机器码交给计算机去执行。
RubyPython、Brython ...

3.Python安装

在Windows环境下：

1.从官网下载2.x系列和3.x系列的安装包：
   https://www.python.org/downloads/
2.安装：
   默认安装路径：C:\python，可自定义安装；
3.配置环境变量：
   【右键计算机】--》【属性】--》【高级系统设置】--》【高级】--》【环境变量】--》【在第二个内容框中找到 变量名为Path 的一行，双击】 --> 【Python安装目录追加到变值值中，用 ； 分割】
    如：原来的值;C:\python27，切记前面有分号

在Linux环境下：

1.Linux环境下，默认安装了python2.x系列；
2.再安装一个3.x系列；

4.pycharm软件

pycharm简介

　　PyCharm是一种Python IDE，带有一整套能够帮助用户在使用Python语言开发时提升其效率的工具，好比调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。

pycharm安装

　　具体安装方法见度娘！

5.中文编码

　　在python2中若是未指定编码，在执行过程当中遇到中文会出现报错：

print "向将来"
--------输出结果---------
SyntaxError: Non-ASCII character '\xe8' in file C:/Users/Administrator/Desktop/python/zjk/zjk1.py on line 28, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

　　Python中默认的编码格式是 ASCII 格式，在没修改编码格式时没法正确打印汉字，因此在读取中文时会报错。

　　解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 就好了。

　　注意：“ #coding=utf-8”等号两边不要加空格；

　　以下：

# -*-coding:UTF-8 -*-
print "向将来"
--------输出结果---------
向将来16:59:4616:59:4916:59:51

　　注意：python3源码文件默认使用utf-8编码，因此能够正常解析中文，无需指定编码，但为了更好更方便使用，最好仍是加上。