Python2与Python 3的对比

首发 http://www.everlose.info/notes/2013/10/31/difference-between-python3-to-python2/python

这篇文章总结了一些与Python2.6相比Python3.0中的新特性.Python3是一个不向后兼容的版本,有了不少的改变,这些对于Python开发者来讲是很是重要的,虽然多数人说Python3真正流行起来还须要一段时间,可是Python3确实有了很大的改进,如今也是时间来学习Python3了。在真正理解Python3中的一些变化以后,会发现其实Python3的变化并无想象的那么多,主要是修复了一些使人讨厌的地方。 缓存

通常在每个发行版源码的Misc/NEWS文件中详细描述了每个细小的变化。 函数

常见的障碍

Print是一个函数

在Python3中print是个函数,这意味着在使用的时候必须带上小括号,而且它是带有参数的。 工具

old: print "The answer is", 2+2
new: print("The answer is", 2+2)  

old: print x,      # 末尾加上逗号阻止换行  
new: print(x, end="") # 使用空格来代替新的一行  

old: print >>sys.staerr, "fatal error"  
new: print ("fatal error", file=sys.stderr)  

old: print (x, y)   # 打印出元组(x, y) 
new: print((x, y))  # 同上,在python3中print(x, y)的结果是跟这不一样的

在Python3中还能够定义分隔符,使用参数sep来指定. 学习

print("There are <", 2+5, ">possibilities", sep="")

上面代码的结果以下: ui

There are <7> possibilities

注意: 编码

  • print()函数不支持Python2.X中print中的“软空格”。在Python2.X中,print "A\n", "B"的结果是"A\nB\n";而在Python3中print("A\n", "B")的结果是"A\n B\n"rest

  • 在刚开始使用Python3的时候,你会发现你常常在交互模式下你仍是常用老式的语法print x,是时候锻炼你的手指用print(x)来取代它啦。 code

  • 若是你的项目比较大,而又想升级到Python3的时候,不用担忧,2to3这个工具会将全部的print语句转换为print()函数。 排序

使用Views和Iterators代替Lists

  • dict的方法dict.keys(),dict.items(),dict.values()不会再返回列表,而是返回一个易读的“views”。这样一来,像这样的语法将再也不有用了:k = d.keys();k.sort(),你可使用k = sorted(d)来代替。sorted(d)在Python2.5及之后的版本中也有用,可是Python3效率更高了。
d = {'a': 1}
d.keys()     # dict_keys(['a'])  
d.items()    # dict_items([('a', 1)])  
d.values()   # dict_values([1])  
k = d.keys(); k.sort()     # AttributeError: 'dict_keys' object has no attribute 'sort'
  • 一样,dict.iterkeys(),dict.iteritems(),dict.itervalues()方法也再也不支持。

  • map()filter()将返回iterators。若是你真的想要获得列表,list(map(...))是一个快速的方法,可是更好的方法是使用列表推导(尤为是原代码使用了lambda表达式的时候),或者重写原来的代码,改成不须要使用列表。特别是map()会给函数带来反作用,正确的方法是改成使用for循环,由于建立一个列表是很是浪费的事情。

  • Python3中的range()函数跟Python2.X的xrange()函数的做用是同样的,这样可使用任意的数字,Python3中去除了xrange()函数。

  • zip()在Python3中返回的是一个迭代器。

比较符

Python3简化了比较符。

  • 在使用比较符(<,<=,>=,>)时,当相比较的操做数的排序是没有意义的时候将会抛出TypeError异常,所以像1 < '',0 > None,len <= len这样的语句再也不合法了。None < None也会抛出TypeError异常,而不是返回False。你应该明白了,胡乱的比较是没有意义的,相比较的元素必须是可以比较的才行。须要注意的是,==!=不包括在内,由于不一样类型的,没法比较元素老是不等于另外一个的。

  • builtin.sortedlist.sort()再也不有提供比较函数的cmp参数,只有参数keyreverse

  • cmp()函数应该当作被去除了,__cmp__()特殊方法也再也不支持。在须要的时候使用__lt__,__eg____hash__

整型数

  • 从本质上来讲,long重命名了int,由于在内置只有一个名为int的整型,但它基本跟以前的long同样。

  • 1/2这样的语句将返回float,即0.5。使用1//2来获取整型,这也是以前版本所谓的“地板除”。

  • 移除了sys.maxint,由于整型数已经没了限制。sys.maxsize能够用来当作一个比任何列表和字符串下标都要大的整型数。

  • repr()中比较大的整型数将再也不带有L后缀。

  • 八进制数的字面量使用0o720代替了0720

Text Vs. Data 代替 Unicode Vs. 8-bit

Python3中改变了二进制数据和Unicode字符串。

  • Python3使用文本和(二进制)数据的理念代替以前的Unicode字符串和8-bit字符串,全部的文本默认是Unicode编码。使用str类型保存文本,使用bytes类型保存数据。当你混淆文本和数据的时候Python3会抛出TypeError的错误。

  • 不能再使用u"..."字面量表示unicode文本,而必须使用b"..."字面量表示二进制数据。

  • 由于strbytes不能弄混,因此你必须显式地将他们进行转换。使用str.encode()str转换为bytes,使用bytes.decode()bytes转换为str,也可使用bytes(s, encoding=...)str(b, encoding=...)

  • strbytes都是不可变的类型,有一个分离的可变类型的bytearray能够保存缓存的二进制数据,全部可以接受bytes的API都可以使用bytearray。这些可变的API是基于collections.MutableSequence的。

  • 移除了抽象类型basestring,使用str代替。

  • 文件默认使用文本类型打开,这也是open()函数默认的。若是要打开二进制文件必须使用b参数,不然会出现错误,而不会默默地提供错误的数据。

  • 文件名都使用unicode字符串传入和输出。

  • 一些关于系统的API,如os.environsys.argv,当系统容许bytes而且不能正常转换为unicode的话,也会出现问题。因此,将系统的LANG设置好是最好的作法。

  • repr()函数再也不转义非ASCII字符。

  • 代码默认为UTF-8编码。

  • 移除了StringIOcStringIO。加入了io模块,并分别使用io.StringIOio.BytesIO分别用于text和data。

语法改变

新增语法

  • 函数变量和返回值annotations

  • Keyword-only变量。

  • nonlocal声明。使用nonlocal x能够直接引用一个外部做用域的变量,但不是全局变量。

  • 扩展了迭代的解包。

(a, *rest, b) = range(5)  
a   # 0
rest # [1,2,3]
b   # 4
  • 字典推导。{k: v for k, v in stuff }
t = ((1,1), (2,2))  
d = {k: v for k, v in t}  
d     # {1: 1, 2: 2}
  • 集合推导。{x for x in stuff},与set(stuff)效果同样,可是更加灵活。

  • 八进制字面量0o720

  • 二进制字面量0b1010,至关于新的内置函数bin()

  • 字节字面量b或者B,至关于新的内置函数bytes()

改变的语法

  • except exc, var改成except exc as var

  • 新的元类语法。

# old  
class C:
    __metaclass__ = M
    ....  

# new  
class C(metaclass=M):  
    ....
  • 列表推导再也不支持[... for var in item1, item2, ...],必须写成[... for var in (item1, item2,...)]

  • 省略号...做为连续表达式能够用于任何地方,以前只能用于分片中。可是必须连续写,以前带空格的. . .再也不支持。

移除的语法

  • 移除了元组的解包。不能再写def foo(a, (b, c)): ....,须要写成def foo(a, b_c):b, c = b_c

  • 移除<>,使用!=代替。

  • exec()不能再做为关键词,只能做为一个函数。而且exec()再也不支持流变量,如exec(f)需写成exec(f.read())

  • 整型不支持l/L后缀。

  • 字符串不支持'u/U'前缀。

  • from module import *只能用在模块级,在函数中不可以使用。

  • 全部不以.开始的import语句均做为绝对路径的import对待。

  • 移除了经典类。

相关文章
相关标签/搜索