能够在线运行查看效果哦php
在web开发中,咱们常常会遇到须要处理批量任务的时候,这些批量任务多是用户提交的,也多是当系统被某个事件触发时须要进行批量处理的,面对这样的任务,若是是用户提交的批量任务,初级程序员只能让用户触发提交动做后,等待服务器处理完毕,而且将结果返回到浏览器,期间用户不能关掉浏览器窗口,若是数据比较大,或者处理速度比较慢,那用户体验将会所以受到直接影响。可是当咱们使用某讯或者某浪的邮箱时,点击群发邮件以后,只需等待很短的时间,浏览器提示提交成功,正在发送之类的信息时,用户就能够关掉浏览器,稍后,收件地址栏里的邮箱将陆续收到该群发邮件,再好比群发定时邮件,以及当商城系统中有客户下单,客户,客服,仓库等相关人员收到订单邮件信息。诸如此类,队列的应用范围是如此之广。mysql
二 :普通工程师的解决方案和架构师的解决方案linux
方案1:建表存邮件,消息等,用定时程序取出发送。程序员
方案2:抽象到更高一层,开发一套通用异步处理队列适用于任何复杂的业务逻辑web
那么,做为架构师,使用队列的作法,将抽象层和业务层分离,可具备良好的扩展性和可维护性。相比较而言就高明了许多,下面就咱们介绍一下自定义队列的实现思路和方法。sql
三 :队列整体设计shell
1:须要队列程序,提供加入队列接口和取队列接口等数据库
2:须要存储队列,文件或者数据库json
3:须要定时程序取出队列并执行数组
4:其它扩展功能:优先级,日志,定时等
代码的目录结构以下,每一个文件的做用用//注释来标明
|--addTask.php //添加任务到队列的例子
|--cronMission.php //定时任务调度程序,例如linux中受crontab直接调用的文件,业务逻辑工程师能够在这个文件中灵活定义本身的队列任务,从而不用每一个队列任务都须要上服务器修改crontab,从而在安全性,便捷性方面有很大提升
|--db.php //数据库操做
|--db.sql //创建队列须要用到的基本表结构
|--doQueue.php //执行队列任务
|--Queue.class.php //队列核心业务在这里定义,包括将任务加入队列,读队列,更改队列任务状态
|--sendMsg.php //队列要实现具体任务的业务接口,好比现有系统的发送消息的接口,这里例子中由于将此队列程序和现有系统系统集成,用写入日志来演示
四 :队列具体实现一:建任务存储表
一、
先来个最基本的:
CREATE TABLE `queue` ( id int(11) NOT NULL auto_increment primary key, taskphp varchar(128) NOT NULL default '', param text not null default '', status tinyint not null default 0, ctime timestamp NOT NULL default CURRENT_TIMESTAMP, KEY (ctime) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
字段解释:
taskphp:处理业务的接口文件
param:处理业务的接口文件须要接收的参数
status:任务处理状态,0为未处理,处理完毕更改成1
五 :队列具体实现二:定义调用接口
<?php /** 优才网公开课示例代码 * 任务队列实现 * @author 优才网全栈工程师教研组 张友林 @see http://www.ucai.cn */ include_once('db.php'); class Queue { /** 把任务扔到队列 * * @param string $taskphp 执行任务的程序 * @param string $param 执行任务程序所用的参数 例如,群发消息加入队列: $arr = array( "uid" => 4,//发信息的人的UID "uids" => array(6,234,34,67,7888,2355), //接收信息的人的UID "content" => 'xxxxx',//信息内容 ); $cqueue = new Queue(); $cqueue->add("/app/send_msg.php", serialize($arr)); * */ public function add($taskphp,$param) { $taskphp = mysql_real_escape_string($taskphp); //$param = mysql_real_escape_string($param); $param = $param; $sql = "insert into queue (taskphp, param) values('".$taskphp."', '".$param."')"; $re = execute($sql); if ($re) { $pid = mysql_insert_id(); return $pid; } else { return false; } } /** 读取任务队列 * * @param string $limit 一次取多少条 */ public function getQueueTask($limit = 1000) { $limit = (int)$limit; $sql = "select id, taskphp, param from queue where status = 0 order by id asc"; $re = query($sql); return $re; } /** 更新任务状态 * * @param string $limit 一次取多少条 */ public function updateTaskByID($id) { $id = (int)$id; $mtime = time(); $sql = "update queue set status =1, mtime = ".$mtime." where id = ".$id; $re = execute($sql); return $re; } public static function a2s($arr) { $str = ""; foreach ($arr as $key => $value) { if (is_array($value)) { foreach ($value as $value2) { $str .= urlencode($key) . "[]=" . urlencode($value2) . "&"; } } else { $str .= urlencode($key) . "=" . urlencode($value) . "&"; } } return $str; } public static function s2a($str) { $arr = array(); parse_str($str, $arr); return $arr; } } ?> $cqueue = new Queue();
1: 加入队列接口
//$param1 为执行任务的程序,$param2 为程序参数,能够为序列化的数据
$cqueue->add($param1,$param2);
2: 读取队列接口
$tasks = $cqueue->getQueueTask($limit = 1000);
3:更新任务状态
$cqueue->updateTaskStatus($id);
4:a2s是自定义的一个数组转换字符串方法,这里不要使用json_encode,容易出现问题,一样,从数据库中取出转换为数组的时候,使用s2a方法
$re = $cqueue->add("sendMsg.php", Queue::a2s($arr));
根据设计,执行队列的程序文件是 do_queue.php , 它的主要功能是把任务从队列表里取出来,而且在后台执行。
do_queue.php部分代码:
$phpcmd = exec("which php"); //查找到php安装位置 $cqueue = new Queue(); $tasks = $cqueue->getQueueTask(200); foreach ($tasks as $t) { $taskphp = $t['taskphp']; $param = $t['param']; $job = $phpcmd . " " . escapeshellarg($taskphp) . " " . escapeshellarg($param); system($job); }
七 :具体任务的业务实现
仍是拿群发消息来作例子,咱们须要写好一个群发消息的程序,这个程序接收事先定义好的参数,而后根据参数调用发消息的接口把消息发送出去。
这个通常由作业务功能的工程师实现。可是架构师事先得写文档例子,教会别人使用
send_msg.php: $para = $argv[1]; $arr = unserialize($para); $cmessage = new Message(); foreach($arr['uids'] as $touid) { $cmessage->send($arr['uid'], $touid, $arr['content']); }
八 : 服务器部署一:配置crontab
我们执行队列的程序都写好了, 这个程序怎么触发呢,固然就要用到linux的定时任务,每隔必定的时间,执行do_queue.php一次。可是呢,这里不是直接调用do_queue.php,我们再提升一层,加个调度程序cron_mission.php, 在cron_mission.php里面调用do_queue.php
配置定时任务 crontab:
crontab –e * * * * * cd /ucai/schedule; php cron_mission.php >> cron_mission.log
#能够先使用crontab -l查看本机已经使用的定时任务
九 :服务器部署二:写定时任务调度程序
思路:将定时任务写入到任务调度程序cron_mission.php中,这样能够在cron_mission.php中灵活控制队列任务。相比较直接经过crontab控制doQueue.php而言,避免了频繁修改服务器上的crontab,从安全,便于维护等角度来讲,都是上策。
cron_mission.php 示例:
if ($minute % 5 == 0) { if(chdir($site_dir."app/")) { $cmd = "$phpcmd do_queue.php > do_queue.log &"; echo '[' , $ymd , ' ' , $hour , ':' , $minute , '] ' , $cmd , "\n"; system($cmd); } }
十 :开启多进程并发执行队列
思路:对任务序列进行编号,数据库中执行的时候
where条件加上id%每一个队列要执行任务总数=队列编号
这样能够避免重复处理
例如:每一个进程执行10条任务,修改以下
1:定时任务的修改
修改前:
if ($minute % 5 == 0) { if(chdir($site_dir."app/")) { $cmd = "$phpcmd do_queue.php > do_queue.log &"; echo '[' , $ymd , ' ' , $hour , ':' , $minute , '] ' , $cmd , "\n"; system($cmd); } }
修改后:
if ($minute % 5 == 0) { for ($i=0; $i < 10; $i++) { $cmd = "$phpcmd doQueue.php 10 $i>> doQueueMission".date('Y-m-d').".log "; echo date("Y-m-d H:i:s") . "\t : " .$cmd."\n"; system($cmd); } }
//每次进行10个进程,$i来区分是当前的进程标示
2:队列执行程序的修改
修改前:
$phpcmd = 'D:\work\wamp\bin\php\php5.3.10\php '; $cqueue = new Queue(); $tasks = $cqueue->getQueueTask(200);
修改后:
$phpcmd = 'D:\work\wamp\bin\php\php5.3.10\php '; $total=$argv[1]; $i=$argb[2]; $cqueue = new Queue(); $tasks = $cqueue->getQueueTask($total,$i,200);
3:取队列接口的修改
修改前:
public function getQueueTask($limit = 1000) { $limit = (int)$limit; $sql = "select id, taskphp, param from queue where status = 0 order by id asc"; $re = query($sql); return $re; }
修改后:
public function getQueueTask($total,$i,$limit = 1000) { $limit = (int)$limit; $sql = "select id, taskphp, param from queue where status = 0 and id%$total=$i order by id asc"; $re = query($sql); return $re; }
4:须要关注服务器压力
进程数定为多少,取决于服务器压力
十一 :实现任务优先级
1:任务存储表加优先级字段
在数据表里,加一个优先级字段,按字段值的数值大小来区分优先级
2:修改取队列任务接口,按优先级取
一样是在sql语句中增长order by
十二 :记录队列日志
1:关键地方加echo
2:shell脚本的>>和>的各自做用
总结:
咱们这里的队列实现借助了服务器的计划任务来实现,例如linux中的crontab,这自己是linux系统中的一个程序,平时咱们还可使用他来进行定时执行.sh脚本,例如将数据库备份打包并ftp传送到指定服务器上,这个功能不须要借助php脚本,直接用.sh脚本就能够实现。在这里咱们巧妙的将crontab和php脚本结合,而且使用crontab来不断调用一个队列调度接口cronMission.php,再经过cronMission.php直接来控制具体何时或者是知足什么条件来执行什么队列任务。
这里面几个须要注意的地方
1:往数据库中存取数据时,不要直接使用json_encode或者json_decode,容易形成一些意外问题,在代码中,咱们定义了a2s和s2a两个方法,分别是处理数组转为字符串,和从数据库中读取字符串后转为数组。
2:当任务量比较大,同时服务器负载又没有充分利用的时候,可使用多进程并发处理,在并发处理的时候须要考虑一个问题,就是如何避免重复,在这里咱们使用了,对队列任务进行标记,每次从数据库中读取一个进程须要处理的一批任务,使用数据库中id与批次标示取余等于0的方法来区分,避免不一样批次的队列,重复处理相同任务。(上面步骤10中有具体实现)