Python之路，Day 1.1，Python基础1

时间 2019-11-13

标签 python 之路 day 1.1 基础栏目 Python 繁體版

原文原文链接

本周学习内容：html

Python介绍
Hello World程序
变量、字符编码
用户输入
交互程序与格式化输出
.pyc是个什么鬼？

1、 Python介绍

Python 是一门什么样的语言？

编译型和解释型、静态语言和动态语言、强类型定义语言和弱类型定义语言java

编译器是把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机能够直接以机器语言来运行此程序,速度很快; python

而解释器则是只在执行程序时,才一条一条的解释成机器语言给计算机来执行,因此运行速度是不如编译后的程序运行的快的. linux

编译型vs解释型程序员

编译型算法

优势：编译器通常会有预编译的过程对代码进行优化。由于编译只作一次，运行时不须要编译，因此编译型语言的程序执行效率高。能够脱离语言环境独立运行。shell

缺点：编译以后若是须要修改就须要整个模块从新编译。编译的时候根据对应的运行环境生成机器码，不一样的操做系统之间移植就会有问题，须要根据运行的操做系统环境编译不一样的可执行文件。编程

解释型vim

优势：有良好的平台兼容性，在任何环境中均可以运行，前提是安装了解释器（虚拟机）。灵活，修改代码的时候直接修改就能够，能够快速部署，不用停机维护。浏览器

缺点：每次运行的时候都要解释一遍，性能上不如编译型语言。

动态语言和静态语言

一般咱们所说的动态语言、静态语言是指动态类型语言和静态类型语言。

（1）动态类型语言：动态类型语言是指在运行期间才去作数据类型检查的语言，也就是说，在用动态类型的语言编程时，永远也不用给任何变量指定数据类型，该语言会在你第一次赋值给变量时，在内部将数据类型记录下来。Python和Ruby就是一种典型的动态类型语言，其余的各类脚本语言如VBScript也多少属于动态类型语言。

（2）静态类型语言：静态类型语言与动态类型语言恰好相反，它的数据类型是在编译其间检查的，也就是说在写程序时要声明全部变量的数据类型，C/C++是静态类型语言的典型表明，其余的静态类型语言还有C#、JAVA等。

强类型定义语言和弱类型定义语言

（1）强类型定义语言：强制数据类型定义的语言。也就是说，一旦一个变量被指定了某个数据类型，若是不通过强制转换，那么它就永远是这个数据类型了。举个例子：若是你定义了一个整型变量a,那么程序根本不可能将a看成字符串类型处理。强类型定义语言是类型安全的语言。

（2）弱类型定义语言：数据类型能够被忽略的语言。它与强类型定义语言相反, 一个变量能够赋不一样数据类型的值。

Python的优缺点

先看优势

Python的定位是“优雅”、“明确”、“简单”，因此Python程序看上去老是简单易懂，初学者学Python，不但入门容易，并且未来深刻下去，能够编写那些很是很是复杂的程序。
开发效率很是高，Python有很是强大的第三方库，基本上你想经过计算机实现任何功能，Python官方库里都有相应的模块进行支持，直接下载调用后，在基础库的基础上再进行开发，大大下降开发周期，避免重复造轮子。
高级语言————当你用Python语言编写程序的时候，你无需考虑诸如如何管理你的程序使用的内存一类的底层细节
可移植性————因为它的开源本质，Python已经被移植在许多平台上（通过改动使它可以工做在不一样平台上）。若是你当心地避免使用依赖于系统的特性，那么你的全部Python程序无需修改就几乎能够在市场上全部的系统平台上运行
可扩展性————若是你须要你的一段关键代码运行得更快或者但愿某些算法不公开，你能够把你的部分程序用C或C++编写，而后在你的Python程序中使用它们。
可嵌入性————你能够把Python嵌入你的C/C++程序，从而向你的程序用户提供脚本功能。

再看缺点：

速度慢，Python 的运行速度相比C语言确实慢不少，跟JAVA相比也要慢一些，所以这也是不少所谓的大牛不屑于使用Python的主要缘由，但其实这里所指的运行速度慢在大多数状况下用户是没法直接感知到的，必须借助测试工具才能体现出来，好比你用C运一个程序花了0.01s,用Python是0.1s,这样C语言直接比Python快了10倍,算是很是夸张了，可是你是没法直接经过肉眼感知的，由于一个正常人所能感知的时间最小单位是0.15-0.4s左右，哈哈。其实在大多数状况下Python已经彻底能够知足你对程序速度的要求，除非你要写对速度要求极高的搜索引擎等，这种状况下，固然仍是建议你用C去实现的。
代码不能加密，由于PYTHON是解释性语言，它的源码都是以名文形式存放的，不过我不认为这算是一个缺点，若是你的项目要求源代码必须是加密的，那你一开始就不该该用Python来去实现。
线程不能利用多CPU问题，这是Python被人诟病最多的一个缺点，GIL即全局解释器锁（Global Interpreter Lock），是计算机程序设计语言解释器用于同步线程的工具，使得任什么时候刻仅有一个线程在执行，Python的线程是操做系统的原生线程。在Linux上为pthread，在Windows上为Win thread，彻底由操做系统调度线程的执行。一个python解释器进程内有一条主线程，以及多条用户程序的执行线程。即便在多核CPU平台上，因为GIL的存在，因此禁止多线程的并行执行。关于这个问题的折衷解决方法，咱们在之后线程和进程章节里再进行详细探讨。

Python解释器

当咱们编写Python代码时，咱们获得的是一个包含Python代码的以.py为扩展名的文本文件。要运行代码，就须要Python解释器去执行.py文件。

因为整个Python语言从规范到解释器都是开源的，因此理论上，只要水平够高，任何人均可以编写Python解释器来执行Python代码（固然难度很大）。事实上，确实存在多种Python解释器。

CPython

当咱们从Python官方网站下载并安装好Python 2.7后，咱们就直接得到了一个官方版本的解释器：CPython。这个解释器是用C语言开发的，因此叫CPython。在命令行下运行python就是启动CPython解释器。

CPython是使用最广的Python解释器。教程的全部代码也都在CPython下执行。

IPython

IPython是基于CPython之上的一个交互式解释器，也就是说，IPython只是在交互方式上有所加强，可是执行Python代码的功能和CPython是彻底同样的。比如不少国产浏览器虽然外观不一样，但内核其实都是调用了IE。

CPython用>>>做为提示符，而IPython用In [序号]:做为提示符。

PyPy

PyPy是另外一个Python解释器，它的目标是执行速度。PyPy采用JIT技术，对Python代码进行动态编译（注意不是解释），因此能够显著提升Python代码的执行速度。

绝大部分Python代码均可以在PyPy下运行，可是PyPy和CPython有一些是不一样的，这就致使相同的Python代码在两种解释器下执行可能会有不一样的结果。若是你的代码要放到PyPy下执行，就须要了解PyPy和CPython的不一样点。

Jython

Jython是运行在Java平台上的Python解释器，能够直接把Python代码编译成Java字节码执行。

IronPython

IronPython和Jython相似，只不过IronPython是运行在微软.Net平台上的Python解释器，能够直接把Python代码编译成.Net的字节码。

Python的解释器不少，但使用最普遍的仍是CPython。若是要和Java或.Net平台交互，最好的办法不是用Jython或IronPython，而是经过网络调用来交互，确保各程序之间的独立性。

2、Hello World程序

在linux 下建立一个文件叫hello.py,并输入

 
         print 
         ( 
         "Hello World!" 
         )

而后执行命令:python hello.py ,输出

 
         localhost:~ jieli$ vim hello.py 
        
         localhost:~ jieli$ python hello.py 
        
         Hello World!

指定解释器

上一步中执行 python hello.py 时，明确的指出 hello.py 脚本由 python 解释器来执行。

若是想要相似于执行shell脚本同样执行python脚本，例： ./hello.py ，那么就须要在 hello.py 文件的头部指定解释器，以下：

 
        #!/usr/bin/env python 
       
        print  
        "hello,world"

如此一来，执行： ./hello.py 便可。

ps：执行前需给予 hello.py 执行权限，chmod 755 hello.py

ps: #!user/bin/python 目录已经写死，会用到python默认装在系统内的低版本解释器；相对而言，上方是在整个系统环境下寻找python，用于声明所须要的解释器

3、变量\字符编码

变量定义的规则：

变量名只能是字母、数字或下划线的任意组合
变量名的第一个字符不能是数字
如下关键字不能声明为变量名
['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

python解释器在加载 .py 文件中的代码时，会对内容进行编码（python2 默认ascill，python3 utf-8）。

ASCII（American Standard Code for Information Interchange，美国标准信息交换代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其余西欧语言，其最多只能用 8 位来表示（一个字节），即：2**8 = 256-1，因此，ASCII码最多只能表示 255 个符号。

关于中文

为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

GB2312 支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。如今的PC平台必须支持GB18030，对嵌入式产品暂不做要求。因此手机、MP3通常只支持GB2312。

从ASCII、GB23十二、GBK 到GB18030，这些编码方法是向下兼容的，即同一个字符在这些方案中老是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文能够统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB23十二、GBK到GB18030都属于双字节字符集 (DBCS)。

有的中文Windows的缺省内码仍是GBK，能够经过GB18030升级包升级到GB18030。不过GB18030相对GBK增长的字符，普通人是很难用到的，一般咱们仍是用GBK指代中文Windows内码。

显然ASCII码没法将世界上的各类文字和符号所有表示，因此，就须要新出一种能够表明全部字符和符号的编码，即：Unicode

Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每一个字符设定了统一而且惟一的二进制编码，规定虽有的字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，
注：此处说的的是最少2个字节，可能更多

UTF-8，是对Unicode编码的压缩和优化，他再也不使用最少使用2个字节，而是将全部的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存...

因此，python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill），若是是以下代码的话：

报错：ascii码没法表示中文

 
         #!/usr/bin/env python 
        
         print  
         "你好，世界"

改正：应该显示的告诉python解释器，用什么编码来执行源代码，即：

 
         #!/usr/bin/env python 
        
         # -*- coding: utf-8 -*- 
        
         print  
         "你好，世界"

4、用户输入　

 1 import getpass
 2 
 3 _username = 'Alex'
 4 _password = 'ab123'
 5 username = input("username:")
 6 #password = getpass.getpass("password:")  # 注意，在CMD中运行良好，在pycharm中有Bug
 7 password = input("password:")
 8 
 9 if _username == username and _password == password:
10     print("Welcome user {name} login...".format(name = username)) # 注意，输入过程当中不能有空格
11 else:
12     print("Invalid password or username!")
13 
14 print(username,password)

 
      #!/usr/bin/env python 
     
      #_*_coding:utf-8_*_ 
     
      #name = raw_input("What is your name?") #only on python 2.x 
     
      name  
      =  
      input 
      ( 
      "What is your name?" 
      ) 
     
      print 
      ( 
      "Hello "  
      +  
      name )

输入密码时，若是想要不可见，须要利用getpass 模块中的 getpass方法，即：

 
         #!/usr/bin/env python 
        
         # -*- coding: utf-8 -*- 
        
         import  
         getpass 
        
         # 将用户输入的内容赋值给 name 变量 
        
         pwd  
         =  
         getpass.getpass( 
         "请输入密码：" 
         ) 
        
         # 打印输入的内容 
        
         print 
         (pwd)

5、交互程序与格式化输出

 1 name = input("name:")
 2 salary = input("salary:")             # 即便在这里输入的是int，可是系统默认为str，info3会报错
 3 job = input("job:")
 4 
 5 info1 = '''---info of ''' + name + '''---
 6 salary:''' + salary + ''' 
 7 job:'''+ job
 8 
 9 
10 info2 = '''--- info of %s ---
11 salary: %s
12 job: %s
13 '''%( name, salary ,job )
14 
15 """
16 info3 = '''--- info of %s ---
17 salary: %d
18 job: %s
19 '''%( name, salary ,job )
20 """
21 
22 info4 = '''--- info of  {_name} ---
23 salary: {_salary}
24 job: {_job}
25 '''.format( _name = name,
26             _salary = salary,
27             _job = job )
28 
29 info5 = '''--- info of  {} ---
30 salary: {}
31 job: {}
32 '''.format(  name,
33              salary,
34              job )                                 # 要求顺序一致，推荐上一种方式
35 
36 print(info1,info2,info4,info5)

6、.pyc是个什么鬼？

1. Python是一门解释型语言？

我初学Python时，听到的关于Python的第一句话就是，Python是一门解释性语言，我就这样一直相信下去，直到发现了*.pyc文件的存在。若是是解释型语言，那么生成的*.pyc文件是什么呢？c应该是compiled的缩写才对啊！

为了防止其余学习Python的人也被这句话误解，那么咱们就在文中来澄清下这个问题，而且把一些基础概念给理清

2. 解释型语言和编译型语言

计算机是不可以识别高级语言的，因此当咱们运行一个高级语言程序的时候，就须要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分红两类，第一种是编译，第二种是解释。

编译型语言在程序执行以前，先会经过编译器对程序执行一个编译的过程，把程序转变成机器语言。运行时就不须要翻译，而直接执行就能够了。最典型的例子就是C语言。

解释型语言就没有这个编译的过程，而是在程序运行的时候，经过解释器对程序逐行做出解释，而后直接运行，最典型的例子是Ruby。

经过以上的例子，咱们能够来总结一下解释型语言和编译型语言的优缺点，由于编译型语言在程序运行以前就已经对程序作出了“翻译”，因此在运行时就少掉了“翻译”的过程，因此效率比较高。可是咱们也不能一律而论，一些解释型语言也能够经过解释器的优化来在对程序作出翻译时对整个程序作出优化，从而在效率上超过编译型语言。

此外，随着Java等基于虚拟机的语言的兴起，咱们又不能把语言纯粹地分红解释型和编译型这两种。

用Java来举例，Java首先是经过编译器编译成字节码文件，而后在运行时经过解释器给解释成机器文件。因此咱们说Java是一种先编译后解释的语言。

3. Python究竟是什么

其实Python和Java/C#同样，也是一门基于虚拟机的语言，咱们先来从表面上简单地了解一下Python程序的运行过程吧。

当咱们在命令行中输入python hello.py时，实际上是激活了Python的“解释器”，告诉“解释器”：你要开始工做了。但是在“解释”以前，其实执行的第一项工做和Java同样，是编译。

熟悉Java的同窗能够想一下咱们在命令行中如何执行一个Java的程序：

javac hello.java

java hello

只是咱们在用Eclipse之类的IDE时，将这两部给融合成了一部而已。其实Python也同样，当咱们执行python hello.py时，他也同样执行了这么一个过程，因此咱们应该这样来描述Python，Python是一门先编译后解释的语言。

4. 简述Python的运行过程

在说这个问题以前，咱们先来讲两个概念，PyCodeObject和pyc文件。

咱们在硬盘上看到的pyc天然没必要多说，而其实PyCodeObject则是Python编译器真正编译成的结果。咱们先简单知道就能够了，继续向下看。

当python程序运行时，编译的结果则是保存在位于内存中的PyCodeObject中，当Python程序运行结束时，Python解释器则将PyCodeObject写回到pyc文件中。

当python程序第二次运行时，首先程序会在硬盘中寻找pyc文件，若是找到，则直接载入，不然就重复上面的过程。

因此咱们应该这样来定位PyCodeObject和pyc文件，咱们说pyc文件实际上是PyCodeObject的一种持久化保存方式。