由于近来在研究 Mogilefs 的分布文件系统,在读读这个的源码,另外,为公司新设计了一个下载的系统,因此更加要深刻研究一下,由于这个好东西是 Perl 写的,真不容易,在读这个的时间发现了几个好东西,其中一个就是我如今要提到的 Gearman ,这是个分布的任务分发的框架.使用 Perl 写的.后来用 C 重写了其中一些部分.做者 Brad Fitzpatrick 大神开发的 Gearman, 他原来是 livejournal 的成员,设计最初也是用于LiveJournal的图片 resize 功能,目前是 Google 的成员.php
简单的讲, Gearman 就是一个用 Perl 写的任务调度程序,它能提供一个服务器端进行任务调度,本身就不作其它任何事了.客户端同时也提供了多种语言接口.Gearman 这个框架系统主要的工做是用来委派任务给其余机器,Mogilefs 的分布文件系统的核心就是用的这个.因此咱们能够基于这个作一个本身的 Cluster 出来.html
这个软件的应用场景能够不少,好比 Web 2.0 的项目中,好比经常使用的视频网站的视频处理,分布式日志处理,电子邮件处理,文件同步处理,图片处理等等,只要是能够放开,不影响体验和响应的场景,须要并行进行大量计算和处理的程序,都是能够的.不要由于 Gearman 是 Perl 写的而认为通用性就不行,由于设计时就是独立于语言和平台的.因此客户端能够是任何语言,象 Perl,PHP,Python,Ruby之类.就算是 Shell 也行web
Gearman 的做者 Eric Day 介绍,Yahoo! 在 60 或更多的服务器上使用 Gearman 天天处理 600 万个做业.新闻聚合器 Digg 也已构建了一个相同规模的 Gearman 网络,天天可处理 400,000 个做业.Gearman 的一个出色例子能够在 Narada 这个开源搜索引擎中找到.服务器
Gearman 的架构
一个链接客户机和 Workerer 链接在 Gearman 上组成一个网络,也就是 Gearman 请求的处理过程涉及三个部分:Client -> Job -> Worker.这种实际网络中是很是经常使用的.而后咱们的应用提交程序来作客户端的程度,提交任务.到了 Job Server 的队列中,由 Worker 的服务器来取下来,并处理这个任务,因此咱们能够看出 Gearman 自己从客户机收集工做请求并充当一个注册器这二个事.网络
如图架构
Gearman 怎么样工做负载均衡
Gearman 不但能够作为任务分发,还能够作为应用方面是负载均衡,咱们可让 Workerer 放在不一样的一堆服务器上,也能够启动放在同一个 CPU 的多个核上,好比,以咱们经常使用的应用视频转换程序,可是不但愿 Web 的服务器来处理视频的格式处理的过程,这时,咱们就能够在这一堆服务器上进行任务分发,在上面加载 Workerer 处理视频格式处理和转换.这样对外的 web 服务器将不会被视频转换的过程影响,同时也能不少的让全部服务器负载均衡的工做来处理,也很是方便扩展,加一个机器到任务调度中心,注册成 Workerer 就行,这时 Job Server 会在请求到来的时候,将这个请求发给空闲的这个 Workerer. 另外你还能够运行多个Job Server.能够组成一个 HA 的架构,若是一个Job Server 的进程 down了,client 和 Workerer 会自动迁移到另外一台Job Server上.框架
简单来说,就是下面的流程dom
如图异步
从上面能够看出来 Worker 是可扩展的.若是你有须要 Worker 是能够运行任意多个的.
另外,咱们对 Application 是不用过多在乎的.一样也是能够多个的. Application 的客户只有一个任务,就是加入任务到 Gearman 中来.
安装 Gearman 的环境
安装 Gearman::Server 的 Job Server ,若是没有安装 Client 就须要 Client 和 Worker 都装上.若是不会使用 cpanm 的话,参考我之前写过的 使用CPANMinus 来安装Perl 模块
1
2
3
|
$ cpanm Gearman::Server
$ cpanm Gearman::Client
$ cpanm Gearman::Worker
|
使用 Gearman 的功能
Gearman 整体上来看看,分 4 大步的功能.
Gearman 的 Job Server 调度程序的使用
(1. 启动Job:
1
|
$ gearmand -d -L 127.0.0.1 -p 7003
|
1
2
|
$ telnet localhost 7003
status
|
给你们看个实际的输出.
1
2
3
4
5
6
7
|
$ telnet 127.0.0.1 7003
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is
'^]'
.
status
convertVideo 0 0 1
echo 1 0 0
|
能够见到如上的输出,分 4 个部分.
已知任务 – 运行的任务 – 队列中的任务 – 可用的 Worker.
如 convertVideo 0 0 1 .这个部分,注册的任务名为 convertVideo,0 个正常在运行,队列为空,有一个可用的 Worker.
1
2
3
4
5
6
7
8
9
10
11
12
|
$ telnet 127.0.0.1 4730
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is
'^]'
.
worker
ERR unknown_command Unknown+server+command
workers
30 61.139.15.xxx eolxkmntdgalfedjyptoppbphmudgl : getImage
31 61.139.15.xxx ztixxiwqnfhnghzfbeoyktuvrdylin : convert
34 61.139.15.xxx ruqcfefjwuwrsmnalqcsbnoustswxj : convert
33 61.139.15.xxx wfhfphvefnxynlsdpoduiyxlirkrqd : convert
32 61.139.15.xxx hckjonjakmmdtfmrbcyeexozfwxdqr : convert
|
也是 4 个部分
ID – 链接的主机的IP – 识别码 – 注册的功能
Gearman 的任务服务器也支持一个基于文本的协议,来取得一些信息和执行一些管理任务.
他是运行在二进制协议相同的端口上,二者之间的区别在于发送的第一个字符. 若是它是一个 NULL (\0), 那么它是二进制的,若是它不为 NULL,它试图分析文本命令.支持下面的命令:
workers
这会将会列出全部的 woker 信息,有文件描述符,IP地址,ID 和注册的函数的列表.该列表被终止行包含一个单一的'.'(句点).其格式为:
FD IP-ADDRESS CLIENT-ID : FUNCTION …
Arguments:
– None.
status
这会将列出全部已注册的功能的列表.每一个函数在队列中的任务数量,正在运行的 woker, 有多少可用的woker.列表是以制表符分隔的,并且该列表最后包含一个单一的行"."(句点).
其格式为:
FUNCTION\tTOTAL\tRUNNING\tAVAILABLE_WORKERS
Arguments:
– None.
maxqueue
这台任务管理器功能调用的最大队列大小.若是没有给定大小,则使用缺省值.若是是没有参数,则该队列被设定为无限数量.在结束时送 "OK" 字符.
Arguments:
– Function name.
– Optional maximum queue size.
shutdown
关掉服务,若是加了 "graceful" 的参数.在关掉监听的 socket 时会等所有的链接完成时才关
Arguments:
– Optional "graceful" mode.
version
发送这个服务器的版本.
Arguments:
– None.
若是是 Perl 版本的话,还有一个 'gladiator' 的命令.是用 'Devel::Gladiator' Perl 模块实现的,能够用来 debug.
Gearman 作为 worker 来测试
咱们能够启动 Gearman 而后使用 -w 来指定工做在 worker 模式, -f 是用来指定注册的功能名 — 后面是命令行
1
|
$ gearman -w -f passwd -- xargs -I
'{}'
sh -c
"grep '{}' /etc/passwd | tr -d '\n'"
|
Gearman::Worker 的基本语法和使用
这个没有什么好讲的,链接到主 Gearman 调度服务器.而后是经过内部的 register_function 函数来注册一个功能,到 Gearman 的主调度服务器上去.好让调度服务器知道这个 Worker 能处理的任务是什么.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#!/usr/bin/perl
use
strict;
use
warnings;
use
Gearman::Worker;
my
$worker
= Gearman::Worker->new;
$worker
->job_servers(
'127.0.0.1'
);
# Worker 注册可使用的功能,若是视频转换...
$worker
->register_function( convertVideo => \&convertVideo );
# 等待链接的任务
$worker
->work
while
1;
sub
convertVideo{
my
$job
=
shift
;
# TODO 作你要实现的事情,任务
return
$job
->arg;
}
|
Gearman::Client 的基本语法和使用
Gearman::Client 工做分同步和异步二种,默认我打开的是异步的功能,注掉的部分打开就是使用同步调用任务.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
#!/usr/bin/perl
use
strict;
use
warnings;
use
Gearman::Client;
my
$client
= Gearman::Client->new;
$client
->job_servers(
'127.0.0.1'
);
# 设置异步任务
my
$tasks
=
$client
->new_task_set;
$tasks
->add_task(
# 开始任务
convertVideo =>
'new.flv'
,
# 注册回调函数
{ on_complete => \&complete },
);
# 等待任务结束
$tasks
->
wait
;
sub
complete{
my
$result
=
shift
;
print
$
$result
.
"\n"
;
}
# 设置同步任务
#my $resultRef = $client->do_task( "convertVideo", "new.flv" );
#print "$$resultRef\n";
#$client->dispatch_background( "convertVideo","new.flv" );
|
在 0.8 的版本的时候, 这个 Gearman job server 加入了协议的插件支持.第一个支持的是原生的 HTTP 来使用 Gearman protocol. 这个协议的接口能够接收的 send 和 recieve 功能.核心的读和写的功能可使用这个协议插件来支持.
协议插件是给 HTTP 请求映射成 Gearman 的任务.它当前只支持 client 任务的提交,但它可能在将来进行扩展以支持其余类型的请求. 这个插件可使用 GET and POST 来提交, 而后会给这些任务放入给 job server.这个 URL 的请求会被转成功能的调用.象下面这个例子的请求:
1
2
3
4
|
POST /
reverse
HTTP/1.1
Content-
Length
: 12
Hello world!
|
上面这个会给使用 “reverse”这个功能,工做为 “Hello world!”的参数. 这会返回:
1
2
3
4
5
6
|
HTTP/1.0 200 OK
X-Gearman-Job-Handle: H:lap:4
Content-
Length
: 12
Server: Gearman/0.8
!dlrow olleH
|
下面的这些 header 能够传送过去来作为高级的 job 调用:
象这下面这个的例子中, 它运行在低级别的后台做业,只须要象这样发送请求:
1
2
3
4
5
6
|
POST /
reverse
HTTP/1.1
Content-
Length
: 12
X-Gearman-Background: true
X-Gearman-Priority: low
Hello world!
|
这个请求的响应将不会有任何数据,由于它是一个后台做业:
1
2
3
4
|
HTTP/1.0 200 OK
X-Gearman-Job-Handle: H:lap:6
Content-
Length
: 0
Server: Gearman/0.8
|
相关文档 http://search.cpan.org/~dormando/Gearman-Server-1.11/
来源:
http://www.php-oa.com/2010/09/05/perl-gearman-distributed.html