Python 2.x 很快就要失去官方支持了,不过不用慌,从 Python 2 迁移到 Python 3 却并无想象中那么难。我在上周用了一个晚上的时间将一个 3D 渲染器的前端代码及其对应的 PySide迁移到 Python 3,回想起来,尽管在迁移过程当中无可避免地会遇到一些牵一发而动全身的修改,但整个过程相比起痛苦的重构来讲简直是出奇地简单。前端
每一个人都别无选择地有各类必须迁移的缘由:或许是以为已经拖延过久了,或许是依赖了某个在 Python 2 下再也不维护的模块。但若是你仅仅是想经过作一些事情来对开源作贡献,那么把一个 Python 2 应用迁移到 Python 3 就是一个简单而又有意义的作法。python
不管你从 Python 2 迁移到 Python 3 的缘由是什么,这都是一项重要的任务。按照如下三个步骤,可让你把任务完成得更加清晰。ide
一、使用 2to3函数
从几年前开始,Python 在你或许还不知道的状况下就已经自带了一个名叫 2to3 的脚本,它能够帮助你实现大部分代码从 Python 2 到 Python 3 的自动转换。工具
下面是一段使用 Python 2.6 编写的代码:学习
#!/usr/bin/env python # -*- coding: utf-8 -*- mystring = u'abcdé' print ord(mystring[-1])
对其执行 2to3 脚本:spa
$ 2to3 example.py RefactoringTool: Refactored example.py --- example.py (original) +++ example.py (refactored) @@ -1,5 +1,5 @@ #!/usr/bin/env python # -*- coding: utf-8 -*- -mystring = u'abcdé' -print ord(mystring[-1]) +mystring = 'abcdé' +print(ord(mystring[-1])) RefactoringTool: Files that need to be modified: RefactoringTool: example.py
在默认状况下,2to3
只会对迁移到 Python 3 时必须做出修改的代码进行标示,在输出结果中显示的 Python 3 代码是直接可用的,但你能够在 2to3 加上 -w
或者 --write
参数,这样它就能够直接按照给出的方案修改你的 Python 2 代码文件了。code
$ 2to3 -w example.py
[...]
RefactoringTool: Files that were modified:
RefactoringTool: example.py
2to3
脚本不只仅对单个文件有效,你还能够把它用于一个目录下的全部 Python 文件,同时它也会递归地对全部子目录下的 Python 文件都生效。对象
二、使用 Pylint 或 Pyflakesblog
有一些不良的代码在 Python 2 下运行是没有异常的,在 Python 3 下运行则会或多或少报出错误,这种状况并不鲜见。由于这些不良代码没法经过语法转换来修复,因此 2to3
对它们没有效果,但一旦使用 Python 3 来运行就会产生报错。
要找出这种问题,你须要使用 Pylint、Pyflakes(或 flake8封装器)这类工具。其中我更喜欢 Pyflakes,它会忽略代码风格上的差别,在这一点上它和 Pylint 不一样。尽管代码优美是 Python 的一大特色,但在代码迁移的层面上,“让代码功能保持一致”无疑比“让代码风格保持一致”重要得多。
如下是 Pyflakes 的输出样例:
$ pyflakes example/maths example/maths/enum.py:19: undefined name 'cmp' example/maths/enum.py:105: local variable 'e' is assigned to but never used example/maths/enum.py:109: undefined name 'basestring' example/maths/enum.py:208: undefined name 'EnumValueCompareError' example/maths/enum.py:208: local variable 'e' is assigned to but never used
上面这些由 Pyflakes 输出的内容清晰地给出了代码中须要修改的问题。相比之下,Pylint 会输出多达 143 行的内容,并且多数是诸如代码缩进这样可有可无的问题。
值得注意的是第 19 行这个容易产生误导的错误。从输出来看你可能会觉得 cmp
是一个在使用前未定义的变量,实际上 cmp
是 Python 2 的一个内置函数,而它在 Python 3 中被移除了。并且这段代码被放在了 try
语句块中,除非认真检查这段代码的输出值,不然这个问题很容易被忽略掉。
try: result = cmp(self.index, other.index) except: result = 42 return result
在代码迁移过程当中,你会发现不少本来在 Python 2 中能正常运行的函数都发生了变化,甚至直接在 Python 3 中被移除了。例如 PySide 的绑定方式发生了变化、importlib
取代了 imp
等等。这样的问题只能见到一个解决一个,而涉及到的功能须要重构仍是直接放弃,则须要你本身权衡。但目前来讲,大多数问题都是已知的,而且有完善的文档记录。因此难的不是修复问题,而是找到问题,从这个角度来讲,使用 Pyflake 是颇有必要的。
三、修复被破坏的 Python 2 代码
尽管 2to3
脚本可以帮助你把代码修改为兼容 Python 3 的形式,但对于一个完整的代码库,它就显得有点无能为力了,由于一些老旧的代码在 Python 3 中可能须要不一样的结构来表示。在这样的状况下,只能人工进行修改。
例如如下代码在 Python 2.6 中能够正常运行:
class CLOCK_SPEED: TICKS_PER_SECOND = 16 TICK_RATES = [int(i * TICKS_PER_SECOND) for i in (0.5, 1, 2, 3, 4, 6, 8, 11, 20)] class FPS: STATS_UPDATE_FREQUENCY = CLOCK_SPEED.TICKS_PER_SECOND
相似 2to3
和 Pyflakes 这些自动化工具并不能发现其中的问题,但若是上述代码使用 Python 3 来运行,解释器会认为 CLOCK_SPEED.TICKS_PER_SECOND
是未被明肯定义的。所以就须要把代码改为面向对象的结构:
class CLOCK_SPEED: def TICKS_PER_SECOND(): TICKS_PER_SECOND = 16 TICK_RATES = [int(i * TICKS_PER_SECOND) for i in (0.5, 1, 2, 3, 4, 6, 8, 11, 20)] return TICKS_PER_SECOND class FPS: STATS_UPDATE_FREQUENCY = CLOCK_SPEED.TICKS_PER_SECOND()
你也许会认为若是把 TICKS_PER_SECOND()
改写为一个构造函数(用 __init__
函数设置默认值)能让代码看起来更加简洁,但这样就须要把这个方法的调用形式从 CLOCK_SPEED.TICKS_PER_SECOND()
改成 CLOCK_SPEED()
了,这样的改动或多或少会对整个库形成一些未知的影响。若是你对整个代码库的结构烂熟于心,那么你确实能够为所欲为地做出这样的修改。但我一般认为,只要我作出了修改,均可能会影响到其它代码中的至少三处地方,所以我更倾向于不使代码的结构发生改变。
在学习Python的过程当中,每每由于没有资料或者没人指导从而致使本身不想学下去了,所以我特地准备了个群 592539176 ,群里有大量的PDF书籍、教程都给你们无偿使用!不论是学习到哪一个阶段的小伙伴均可以获取到本身相对应的资料!
坚持信念
若是你正在尝试将一个大项目从 Python 2 迁移到 Python 3,也许你会以为这是一个漫长的过程。你可能会费尽心思也找不到一条有用的报错信息,这种状况下甚至会有将代码推倒重建的冲动。但从另外一个角度想,代码本来在 Python 2 中就能够运行,要让它能在 Python 3 中继续运行,你须要作的只是对它稍加转换而已。
但只要你完成了迁移,你就获得了这个模块或者整个应用程序的 Python 3 版本,外加 Python 官方的长期支持。