python的并发模块concurrent

Python3.2开始，标准库为咱们提供了concurrent.futures模块，它提供了ThreadPoolExecutor和ProcessPoolExecutor两个类，实现了对threading和multiprocessing的进一步抽象，对编写线程池/进程池提供了直接的支持,他属于上层的封装，对于用户来讲，不用在考虑那么多东西了。python

官方参考资料:https://pythonhosted.org/futures/git

1.Executor

Exectuor是基础模块，这是一个抽象类，其子类分为ThreadPoolExecutor和ProcessPoolExecutor，分别被用来建立线程池和进程池。github

提供的方法以下：app

Executor.submit(fn, *args, **kwargs)

fn:为须要异步执行的函数
args,kwargs:为给函数传递的参数
就来看看官网的这个例子:异步

 
            with ThreadPoolExecutor(max_workers 
            = 
            1 
            ) as executor: 
           
 
                 
            future  
            = 
            executor.submit( 
            pow 
            ,  
            323 
            ,  
            1235 
            ) 
           
 
                 
            print 
            (future.result()) 
           

咱们使用submit方法来往线程池中加入一个task(pow函数)，submit返回一个Future对象。其中future.result()的result方法的做用是拿到调用返回的结果。若是没有执行完毕就会去等待。这里咱们使用with操做符，使得当任务执行完成以后，自动执行shutdown函数，而无需编写相关释放代码。
关于更多future的具体方法说明看后面的future部分解释。函数

Executor.map(fn, *args, **kwargs)

map(func, *iterables, timeout=None)
此map函数和python自带的map函数功能相似，只不过concurrent模块的map函数从迭代器得到参数后异步执行。而且，每个异步操做，能用timeout参数来设置超时时间，timeout的值能够是int或float型，若是操做timeout的话，会raisesTimeoutError。若是timeout参数不指定的话，则不设置超时间。 post

func：为须要异步执行的函数
iterables：能够是一个能迭代的对象.
timeout：设置每次异步操做的超时时间测试

 
            from 
            concurrent.futures  
            import 
            ThreadPoolExecutor 
           
 
            import 
            requests 
           
 
            URLS  
            = 
            [ 
            'http://www.163.com' 
            ,  
            'https://www.baidu.com/' 
            ,  
            'https://github.com/' 
            ] 
           
 
            def 
            load_url(url): 
           
 
                     
            req 
            = 
            requests.get(url, timeout 
            = 
            60 
            ) 
           
 
                     
            print 
            ( 
            '%r page is %d bytes' 
            % 
            (url,  
            len 
            (req.content))) 
           
 
            executor  
            = 
            ThreadPoolExecutor(max_workers 
            = 
            3 
            ) 
           
 
            executor. 
            map 
            (load_url,URLS) 
           
 
            print 
            ( 
            '主线程结束' 
            ) 
           

submit函数和map函数，根据须要，选一个使用便可。url

Executor.shutdown(wait=True)

此函数用于释放异步执行操做后的系统资源。Executor实现了enter__和__exit使得其对象能够使用with操做符。
在这里能够使用with上下文关键字代替，如上面第一个submit的例子。spa

2.Future对象

submit函数返回future对象，future提供了跟踪任务执行状态的方法,Future实例能够被Executor.submit()方法建立。除了测试以外不该该直接建立。

cancel()：尝试去取消调用。若是调用当前正在执行，不能被取消。这个方法将返回False，不然调用将会被取消，方法将返回True

cancelled()：若是调用被成功取消返回True

running()：若是当前正在被执行不能被取消返回True

done()：若是调用被成功取消或者完成running返回True

result(Timeout = None)：拿到调用返回的结果。若是没有执行完毕就会去等待

exception(timeout=None)：捕获程序执行过程当中的异常

add_done_callback(fn)：将fn绑定到future对象上。当future对象被取消或完成运行时，fn函数将会被调用

3.wait方法

　wait方法接会返回一个tuple(元组)，tuple中包含两个set(集合)，一个是completed(已完成的)另一个是uncompleted(未完成的)。使用wait方法的一个优点就是得到更大的自由度，它接收三个参数FIRST_COMPLETED, FIRST_EXCEPTION 和ALL_COMPLETE，默认设置为ALL_COMPLETED。

　　若是采用默认的ALL_COMPLETED，程序会阻塞直到线程池里面的全部任务都完成，再执行主线程：

 
            #!/usr/bin/env python   
           
 
            # encoding: utf-8   
           
 
            from 
            concurrent.futures  
            import 
            ThreadPoolExecutor,wait,as_completed 
           
 
            import 
            requests 
           
 
            URLS  
            = 
            [ 
            'http://www.163.com' 
            ,  
            'https://www.baidu.com/' 
            ,  
            'https://github.com/' 
            ] 
           
 
            def 
            load_url(url): 
           
 
                 
            req  
            = 
            requests.get(url, timeout 
            = 
            60 
            ) 
           
 
                 
            print 
            ( 
            '%r page is %d bytes' 
            % 
            (url,  
            len 
            (req.content))) 
           
 
            executor  
            = 
            ThreadPoolExecutor(max_workers 
            = 
            3 
            ) 
           
 
            f_list  
            = 
            [] 
           
 
            for 
            url  
            in 
            URLS: 
           
 
                 
            future  
            = 
            executor.submit(load_url,url) 
           
 
                 
            f_list.append(future) 
           
 
            print 
            (wait(f_list)) 
           
 
            print 
            ( 
            '主线程结束' 
            ) 
           

若是采用FIRST_COMPLETED参数，程序并不会等到线程池里面全部的任务都完成。

 
            from 
            concurrent.futures  
            import 
            ThreadPoolExecutor,wait,as_completed 
           
 
            import 
            requests 
           
 
            URLS  
            = 
            [ 
            'http://www.163.com' 
            ,  
            'https://www.baidu.com/' 
            ,  
            'https://github.com/' 
            ] 
           
 
            def 
            load_url(url): 
           
 
                 
            req 
            = 
            requests.get(url, timeout 
            = 
            60 
            ) 
           
 
                 
            print 
            ( 
            '%r page is %d bytes' 
            % 
            (url,  
            len 
            (req.content))) 
           
 
            executor  
            = 
            ThreadPoolExecutor(max_workers 
            = 
            3 
            ) 
           
 
            f_list  
            = 
            [] 
           
 
            for 
            url  
            in 
            URLS: 
           
 
                 
            future  
            = 
            executor.submit(load_url,url) 
           
 
                 
            f_list.append(future) 
           
 
            print 
            (wait(f_list,return_when 
            = 
            'FIRST_COMPLETED' 
            )) 
           
 
            print 
            ( 
            '主线程结束' 
            ) 
           

关于模块的基本使用就是上面的这些。后续会作一些拓展或者案例。