本文转载自:html
目前所在的项目组须要常常执行一些定时任务,因而选择使用 Python 的定时器。git
这种方式最简单,在循环里面放入要执行的任务,而后 sleep 一段时间再执行mongodb
1 2 3 4 5 6 7 8 9 |
from datetime import datetime import time # 每n秒执行一次 def timer(n): while True: print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) time.sleep(n) # 5s timer(5) |
这个方法的缺点是,只能执行固定间隔时间的任务,若是有定时任务就没法完成,好比早上六点半喊我起床。而且 sleep 是一个阻塞函数,也就是说 sleep 这一段时间,啥都不能作。数据库
threading 模块中的 Timer 是一个非阻塞函数,比 sleep 稍好一点,不过依然没法喊我起床。app
1 2 3 4 5 6 7 8 9 |
from datetime import datetime from threading import Timer # 打印时间函数 def printTime(inc): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) t = Timer(inc, printTime, (inc,)) t.start() # 5s printTime(5) |
Timer 函数第一个参数是时间间隔(单位是秒),第二个参数是要调用的函数名,第三个参数是调用函数的参数(tuple)框架
sched 模块是 Python 内置的模块,它是一个调度(延时处理机制),每次想要定时执行某任务都必须写入一个调度。async
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
import sched import time from datetime import datetime # 初始化sched模块的 scheduler 类 # 第一个参数是一个能够返回时间戳的函数,第二个参数能够在定时未到达以前阻塞。 schedule = sched.scheduler(time.time, time.sleep) # 被周期性调度触发的函数 def printTime(inc): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) schedule.enter(inc, 0, printTime, (inc,)) # 默认参数60s def main(inc=60): # enter四个参数分别为:间隔事件、优先级(用于同时间到达的两个事件同时执行时定序)、被调用触发的函数, # 给该触发函数的参数(tuple形式) schedule.enter(0, 0, printTime, (inc,)) schedule.run() # 10s 输出一次 main(10) |
sched 使用步骤以下:ide
(1)生成调度器:
s = sched.scheduler(time.time,time.sleep)
第一个参数是一个能够返回时间戳的函数,第二个参数能够在定时未到达以前阻塞。函数
(2)加入调度事件
其实有 enter、enterabs 等等,咱们以 enter 为例子。
s.enter(x1,x2,x3,x4)
四个参数分别为:间隔事件、优先级(用于同时间到达的两个事件同时执行时定序)、被调用触发的函数,给触发函数的参数(注意:必定要以 tuple 给,若是只有一个参数就(xx,))
(3)运行
s.run()
注意 sched 模块不是循环的,一次调度被执行后就 Over 了,若是想再执行,请再次 enter
终于找到了能够天天定时喊我起床的方式了
APScheduler是一个 Python 定时任务框架,使用起来十分方便。提供了基于日期、固定时间间隔以及 crontab 类型的任务,而且能够持久化任务、并以 daemon 方式运行应用。
使用 APScheduler 须要安装
1 |
$ pip install apscheduler |
首先来看一个周一到周五天天早上6点半喊我起床的例子
1 2 3 4 5 6 7 8 9 |
from apscheduler.schedulers.blocking import BlockingScheduler from datetime import datetime # 输出时间 def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # BlockingScheduler scheduler = BlockingScheduler() scheduler.add_job(job, 'cron', day_of_week='1-5', hour=6, minute=30) scheduler.start() |
代码中的 BlockingScheduler 是什么呢?
BlockingScheduler是APScheduler中的调度器,APScheduler 中有两种经常使用的调度器,BlockingScheduler 和 BackgroundScheduler,当调度器是应用中惟一要运行的任务时,使用 BlockingSchedule,若是但愿调度器在后台执行,使用 BackgroundScheduler。
- BlockingScheduler: use when the scheduler is the only thing running in your process
- BackgroundScheduler: use when you’re not using any of the frameworks below, and want the scheduler to run in the background inside your application
- AsyncIOScheduler: use if your application uses the asyncio module
- GeventScheduler: use if your application uses gevent
- TornadoScheduler: use if you’re building a Tornado application
- TwistedScheduler: use if you’re building a Twisted application
- QtScheduler: use if you’re building a Qt application
APScheduler 四个组件分别为:触发器(trigger),做业存储(job store),执行器(executor),调度器(scheduler)。
包含调度逻辑,每个做业有它本身的触发器,用于决定接下来哪个做业会运行。除了他们本身初始配置意外,触发器彻底是无状态的
APScheduler 有三种内建的 trigger:
date: 特定的时间点触发
interval: 固定时间间隔触发
cron: 在特定时间周期性地触发
存储被调度的做业,默认的做业存储是简单地把做业保存在内存中,其余的做业存储是将做业保存在数据库中。一个做业的数据讲在保存在持久化做业存储时被序列化,并在加载时被反序列化。调度器不能分享同一个做业存储。
APScheduler 默认使用 MemoryJobStore,能够修改使用 DB 存储方案
处理做业的运行,他们一般经过在做业中提交制定的可调用对象到一个线程或者进城池来进行。看成业完成时,执行器将会通知调度器。
最经常使用的 executor 有两种:
ProcessPoolExecutor
ThreadPoolExecutor
一般在应用中只有一个调度器,应用的开发者一般不会直接处理做业存储、调度器和触发器,相反,调度器提供了处理这些的合适的接口。配置做业存储和执行器能够在调度器中完成,例如添加、修改和移除做业。
APScheduler提供了许多不一样的方式来配置调度器,你可使用一个配置字典或者做为参数关键字的方式传入。你也能够先建立调度器,再配置和添加做业,这样你能够在不一样的环境中获得更大的灵活性。
下面来看一个简单的 BlockingScheduler 例子
1 2 3 4 5 6 7 8 9 |
from apscheduler.schedulers.blocking import BlockingScheduler from datetime import datetime def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # 定义BlockingScheduler sched = BlockingScheduler() sched.add_job(job, 'interval', seconds=5) sched.start() |
上述代码建立了一个 BlockingScheduler,并使用默认内存存储和默认执行器。(默认选项分别是 MemoryJobStore 和 ThreadPoolExecutor,其中线程池的最大线程数为10)。配置完成后使用 start() 方法来启动。
若是想要显式设置 job store(使用mongo存储)和 executor 能够这样写:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
from datetime import datetime from pymongo import MongoClient from apscheduler.schedulers.blocking import BlockingScheduler from apscheduler.jobstores.memory import MemoryJobStore from apscheduler.jobstores.mongodb import MongoDBJobStore from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor # MongoDB 参数 host = '127.0.0.1' port = 27017 client = MongoClient(host, port) # 输出时间 def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # 存储方式 jobstores = { 'mongo': MongoDBJobStore(collection='job', database='test', client=client), 'default': MemoryJobStore() } executors = { 'default': ThreadPoolExecutor(10), 'processpool': ProcessPoolExecutor(3) } job_defaults = { 'coalesce': False, 'max_instances': 3 } scheduler = BlockingScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults) scheduler.add_job(job, 'interval', seconds=5, jobstore='mongo') scheduler.start() |
在运行程序5秒后,第一次输出时间。
在 MongoDB 中能够看到 job 的状态
添加job有两种方式:
第二种方法只适用于应用运行期间不会改变的 job,而第一种方法返回一个apscheduler.job.Job 的实例,能够用来改变或者移除 job。
1 2 3 4 5 6 7 8 |
from apscheduler.schedulers.blocking import BlockingScheduler sched = BlockingScheduler() # 装饰器 @sched.scheduled_job('interval', id='my_job_id', seconds=5) def job_function(): print("Hello World") # 开始 sched.start() |
@sched.scheduled_job() 是 Python 的装饰器。
移除 job 也有两种方法:
remove_job 使用 jobID 移除
job.remove() 使用 add_job() 返回的实例
1 2 3 4 5 |
job = scheduler.add_job(myfunc, 'interval', minutes=2) job.remove() # id scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id') scheduler.remove_job('my_job_id') |
暂停一个 job:
1 2 |
apscheduler.job.Job.pause() apscheduler.schedulers.base.BaseScheduler.pause_job() |
恢复一个 job:
1 2 |
apscheduler.job.Job.resume() apscheduler.schedulers.base.BaseScheduler.resume_job() |
但愿你还记得 apscheduler.job.Job 是 add_job() 返回的实例
得到可调度 job 列表,可使用get_jobs() 来完成,它会返回全部的 job 实例。
也可使用print_jobs() 来输出全部格式化的 job 列表。
除了 jobID 以外 job 的全部属性均可以修改,使用 apscheduler.job.Job.modify() 或者 modify_job() 修改一个 job 的属性
1 2 |
job.modify(max_instances=6, name='Alternate name') modify_job('my_job_id', trigger='cron', minute='*/5') |
默认状况下调度器会等待全部的 job 完成后,关闭全部的调度器和做业存储。将 wait 选项设置为 False 能够当即关闭。
1 2 |
scheduler.shutdown() scheduler.shutdown(wait=False) |
scheduler 能够添加事件监听器,并在特殊的时间触发。
1 2 3 4 5 6 7 |
def my_listener(event): if event.exception: print('The job crashed :(') else: print('The job worked :)') # 添加监听器 scheduler.add_listener(my_listener, EVENT_JOB_EXECUTED | EVENT_JOB_ERROR) |
最基本的一种调度,做业只会执行一次。它的参数以下:
1 2 3 4 5 6 7 8 9 10 11 12 |
from datetime import date from apscheduler.schedulers.blocking import BlockingScheduler sched = BlockingScheduler() def my_job(text): print(text) # The job will be executed on November 6th, 2009 sched.add_job(my_job, 'date', run_date=date(2009, 11, 6), args=['text']) sched.add_job(my_job, 'date', run_date=datetime(2009, 11, 6, 16, 30, 5), args=['text']) sched.add_job(my_job, 'date', run_date='2009-11-06 16:30:05', args=['text']) # The 'date' trigger and datetime.now() as run_date are implicit sched.add_job(my_job, args=['text']) sched.start() |
表达式:
1 2 3 4 5 6 7 8 9 10 11 12 |
from apscheduler.schedulers.blocking import BlockingScheduler def job_function(): print("Hello World") # BlockingScheduler sched = BlockingScheduler() # Schedules job_function to be run on the third Friday # of June, July, August, November and December at 00:00, 01:00, 02:00 and 03:00 sched.add_job(job_function, 'cron', month='6-8,11-12', day='3rd fri', hour='0-3') # Runs from Monday to Friday at 5:30 (am) until 2014-05-30 00:00:00 sched.add_job(job_function, 'cron', day_of_week='mon-fri', hour=5, minute=30, end_date='2014-05-30') sched.start() |
参数:
1 2 3 4 5 6 7 8 9 10 11 12 |
from datetime import datetime from apscheduler.schedulers.blocking import BlockingScheduler def job_function(): print("Hello World") # BlockingScheduler sched = BlockingScheduler() # Schedule job_function to be called every two hours sched.add_job(job_function, 'interval', hours=2) # The same as before, but starts on 2010-10-10 at 9:30 and stops on 2014-06-15 at 11:00 sched.add_job(job_function, 'interval', hours=2, start_date='2010-10-10 09:30:00', end_date='2014-06-15 11:00:00') sched.start() |