做者|Ujjwal Dalmia
编译|VK
来源|Towards Data Sciencepython
当咱们开始精通编程语言时,咱们不只但愿实现最终目标,并且但愿使咱们的程序高效。编程
在这个教程中,咱们将学习一些Ipython的命令,这些命令能够帮助咱们对Python代码进行时间分析。机器学习
注意,在本教程中,我建议使用Anaconda。编程语言
要检查一行python代码的执行时间,请使用%timeit。下面是一个简单的例子来了解它的工做原理:函数
#### magics命令%timeit的简单用法 %timeit [num for num in range(20)] #### 输出 1.08 µs ± 43 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
主要注意事项:oop
在要分析的代码行以前使用%timeit性能
它返回代码运行的平均值和标准误差。在上面的示例中,执行了7次,每次执行对该代码循环100万次(默认行为)。这须要平均1.08微秒和43纳秒的标准误差。学习
在调用magic命令时,能够自定义运行和循环的数量。示例以下:.net
#### 在%timeit magic命令中自定义运行和循环数 %timeit -r5 -n100 [num for num in range(20)] 1.01 µs ± 5.75 ns per loop (mean ± std. dev. of 5 runs, 100 loops each)
使用命令选项-r和-n,分别表示执行次数和循环次数,咱们将时间配置文件操做定制为执行5次和循环100次。code
本节向前迈进了一步,并解释了如何分析完整的代码块。经过对%timeit magic命令进行一个小的修改,将单百分比(%)替换为双百分比(%%),就能够分析一个完整的代码块。如下为示例演示,供参考:
#### 使用timeblock%%代码分析 %%timeit -r5 -n1000 for i in range(10): n = i**2 m = i**3 o = abs(i) #### 输出 10.5 µs ± 226 ns per loop (mean ± std. dev. of 5 runs, 1000 loops each)
能够观察到for循环的平均执行时间为10.5微秒。请注意,命令选项-r和-n分别用于控制执行次数和循环次数。
到目前为止,咱们只在分析一行代码或代码块时查看摘要统计信息。若是咱们想评估代码块中每一行代码的性能呢?使用Line_profiler 。
Line_profiler 包可用于对任何函数执行逐行分析。要使用line_profiler软件包,请执行如下步骤:
#### 安装line_profiler软件包 conda install line_profiler
加载扩展—一旦安装,你可使用IPython来加载line_profiler:
#### 加载line_profiler的Ipython扩展 %load_ext line_profiler
时间分析函数—加载后,使用如下语法对任何预约义函数进行时间分析
%lprun -f function_name_only function_call_with_arguments
语法细节:
对line_profiler的调用以关键字%lprun开始,后跟命令选项-f
命令选项以后是函数名,而后是函数调用
在本练习中,咱们将定义一个接受高度(以米为单位)和重量(以磅为单位)列表的函数,并将其分别转换为厘米和千克。
#### 定义函数 def conversion(ht_mtrs, wt_lbs ): ht_cms = [ht*100 for ht in ht_mtrs] wt_kgs = [wt*.4535 for wt in wt_lbs] #### 定义高度和重量列表: ht = [5,5,4,7,6] wt = [108, 120, 110, 98] #### 使用line_profiler分析函数 %lprun -f conversion conversion(ht,wt) --------------------------------------------------------------- #### 输出 Total time: 1.46e-05 s File: <ipython-input-13-41e195af43a9> Function: conversion at line 2 Line # Hits Time Per Hit % Time Line Contents ============================================================== 2 1 105.0 105.0 71.9 ht_cms = [ht*100 for ht in ht_mtrs] 3 1 41.0 41.0 28.1 wt_kgs = [wt*.4535 for wt in wt_lbs]
输出详细信息:
以14.6微秒为单位(参考第一行输出)
生成的表有6列:
第1列(行#)—代码的行号(请注意,第#1行是故意从输出中省略的,由于它只是函数定义语句)
第2列(命中)—调用该行的次数
第3列(时间)—在代码行上花费的时间单位数(每一个时间单位为14.6微秒)
第4列(每次命中平均时间)—第3列除以第2列
第5列(%Time)—在所花费的总时间中,花在特定代码行上的时间百分比是多少
第6列(内容)—代码行的内容
你能够清楚地注意到,高度从米到厘米的转换几乎占了总时间的72%。
利用每一行代码的执行时间,咱们能够部署策略来提升代码的效率。在接下来的3个教程中,咱们将分享一些最佳实践来帮助你提升代码的效率。
我但愿这篇教程能提供帮助,你能学到一些新东西。
欢迎关注磐创AI博客站:
http://panchuang.net/
sklearn机器学习中文官方文档:
http://sklearn123.com/
欢迎关注磐创博客资源汇总站:
http://docs.panchuang.net/