bash&shell系列文章:http://www.cnblogs.com/f-ck-need-u/p/7048359.htmlhtml
/etc/rc.d/init.d/functions几乎被/etc/rc.d/init.d/下全部的Sysv服务启动脚本加载,也是学习shell脚本时一个很是不错的材料,在其中使用了很多技巧。mysql
在该文件中提供了几个有用的函数:sql
daemon
:启动一个服务程序。启动前还检查进程是否已在运行。killproc
:杀掉给定的服务进程。status
:检查给定进程的运行状态。success
:显示绿色的"OK",表示成功。failure
:显示红色的"FAILED",表示失败。passed
:显示绿色的"PASSED",表示pass该任务。warning
:显示绿色的"warning",表示警告。action
:根据进程退出状态码自行判断是执行success仍是failure。confirm
:提示"(Y)es/(N)o/(C)ontinue? [Y]"并判断、传递输入的值。is_true
:"$1"的布尔值表明为真时,返回状态码0,不然返回1。包括t、y、yes和true,不区分大小写。is_false
:"$1"的布尔值表明为假时,返回状态码0。不然返回1。包括f、n、no和false,不区分大小写。checkpid
:检查/proc下是否有给定pid对应的目录。给定多个pid时,只要存在一个目录都返回状态码0。__pids_var_run
:检查pid是否存在,并保存到变量pid中,同时返回几种进程状态码。是functions中重要函数之一。__pids_pidof
:获取进程pid。pidfileofproc
:获取进程的pid。但只能获取/var/run下的pid文件中的值。pidofproc
:获取进程的pid。可获取任意给定pidfile或默认/var/run下pidfile中的值。前三个是functions文件最重要的3个函数,还用到了一些额外的辅助函数,稍稍有点复杂。因此由简至繁,先介绍并展现后面几个函数,再回头解释前3个函数。shell
如下是/etc/init.d/functions文件的开头定义的语句。设置umask值,使得加载该文件的脚本所在shell的umask为22。导出路径变量。但说实话,这个导出的路径变量并不理想,由于要为非rpm包安装的程序设计服务启动脚本时,必须写全路径命令,例如/usr/local/mysql/bin/mysql。所以,能够考虑将/etc/init.d/functions中的语句注释掉。apache
umask 022
# Set up a default search path.
PATH="/sbin:/usr/sbin:/bin:/usr/bin"
export PATH
PS:本文分析的/etc/init.d/functions文件是CentOS 7上的,和CentOS 6有些许区别,但该有的目的和动做都有。bash
包括echo_success、success、echo_failure、failure、echo_passed、passed、echo_warning和warning函数。这几个函数的定义方式和使用方法彻底同样。less
如下是echo_success和success函数的定义语句。ide
echo_success() {
[ "$BOOTUP" = "color" ] && $MOVE_TO_COL
echo -n "["
[ "$BOOTUP" = "color" ] && $SETCOLOR_SUCCESS
echo -n $" OK "
[ "$BOOTUP" = "color" ] && $SETCOLOR_NORMAL
echo -n "]"
echo -ne "\r"
return 0
}
success() {
[ "$BOOTUP" != "verbose" -a -z "${LSB:-}" ] && echo_success
return 0
}
很简单,就是不换行带颜色输出"[ OK ]"字样。memcached
[root@xuexi ~]# . /etc/init.d/functions
[root@xuexi ~]# success
[root@xuexi ~]# [ OK ]
[root@xuexi ~]# echo_success
[root@xuexi ~]# [ OK ]
同理,剩余的几个状态显示函数也同样。函数
[root@xuexi ~]# echo_failure
[root@xuexi ~]# [FAILED]
[root@xuexi ~]# failure
[root@xuexi ~]# [FAILED]
这个函数在写脚本时还比较有用,能够根据退出状态码自动判断是执行success仍是执行failure函数。
action函数定义语句以下:
action() {
local STRING rc
STRING=$1
echo -n "$STRING "
shift
"$@" && success $"$STRING" || failure $"$STRING" # $"string"和"string"没有区别。详细内容可参考本文的评论区
rc=$?
echo
return $rc
}
这个函数定义的颇有技巧。先将第一个参数保存并踢掉,再执行后面的命令("$@"表示执行后面的命令)。因此,当action函数只有一个参数时,action直接返回OK,状态码为0,当超过一个参数时,第一个参数先被打印,再执行从第二个参数开始的命令。
例如:
[root@xuexi ~]# action
[ OK ]
[root@xuexi ~]# action 5
5 [ OK ]
[root@xuexi ~]# action sleeping sleep 3
sleeping [ OK ]
[root@xuexi ~]# action "moving file" mv xxxxxx.sh aaaaa.sh
moving file mv: cannot stat ‘xxxxxx.sh’: No such file or directory
[FAILED]
因此,在脚本中使用action函数时,可让命令执行成功与否的判断显得更"专业"。算是一个比较有趣的函数。
一般,该函数会结合/bin/true和/bin/false命令使用,它们无条件返回0或1状态码。
action $"MESSAGES: " /bin/true
action $"MESSAGES: " /bin/false
例如,mysqld启动脚本中,判断mysqld已在运行时,直接输出启动ok的消息。(但实际上根本没作任何事)
if [ $MYSQLDRUNNING = 1 ] && [ $? = 0 ]; then
# already running, do nothing
action $"Starting $prog: " /bin/true
ret=0
这两个函数的做用是转换输入的布尔值为状态码。
is_true() {
case "$1" in
[tT] | [yY] | [yY][eE][sS] | [tT][rR][uU][eE])
return 0
;;
esac
return 1
}
is_false() {
case "$1" in
[fF] | [nN] | [nN][oO] | [fF][aA][lL][sS][eE])
return 0
;;
esac
return 1
}
当is_true函数的第一个参数(后面的参数会忽略掉)为忽略大小写的t、y、yes或true时,返回状态码0,不然返回1。
当is_false函数的第一个参数(后面的参数会忽略掉)为忽略大小写的f、n、no或false时,返回状态码0,不然返回1。
这个函数通常用不上,由于脚本原本就是为了不交互式的。在CentOS 7的functions中已经删除了该函数定义语句。不过,借鉴下它的处理方法仍是不错的。
如下摘自CentOS 6.6的/etc/init.d/functions文件。
# returns OK if $1 contains $2
strstr() {
[ "${1#*$2*}" = "$1" ] && return 1 # 参数$1中不包含$2时,返回1,不然返回0
return 0
}
# Confirm whether we really want to run this service
confirm() {
[ -x /bin/plymouth ] && /bin/plymouth --hide-splash
while : ; do
echo -n $"Start service $1 (Y)es/(N)o/(C)ontinue? [Y] "
read answer
if strstr $"yY" "$answer" || [ "$answer" = "" ] ; then
return 0
elif strstr $"cC" "$answer" ; then
rm -f /var/run/confirm
[ -x /bin/plymouth ] && /bin/plymouth --show-splash
return 2
elif strstr $"nN" "$answer" ; then
return 1
fi
done
}
第一个函数strstr的做用是判断第一个参数"$1"中是否包含了"$2",若是包含了则返回状态码0。这函数也是一个不错的技巧。
第二个函数confirm的做用是根据交互式输入的值返回不一样的状态码,若是输入的是y或Y或不输入时,返回0。输入的是c或C时,返回状态码2,输入的是n或N时返回状态码1。
因而能够根据confirm的状态值决定是否要继续执行某个程序。
用法和效果以下:
[root@xuexi ~]# confirm
Start service (Y)es/(N)o/(C)ontinue? [Y] Y
[root@xuexi ~]# echo $?
0
[root@xuexi ~]# confirm
Start service (Y)es/(N)o/(C)ontinue? [Y]
[root@xuexi ~]# echo $?
0
[root@xuexi ~]# confirm
Start service (Y)es/(N)o/(C)ontinue? [Y] n
[root@xuexi ~]# echo $?
1
[root@xuexi ~]# confirm
Start service (Y)es/(N)o/(C)ontinue? [Y] c
[root@xuexi ~]# echo $?
2
启动进程时,pid文件很是重要。不只能够经过它判断进程是否在运行,还能够从中读取pid号用来杀进程。
pid文件的路径可能为/var/run/$base.pid文件($base表示进程名的basename),也多是自定义的路径,例如mysql的pid能够自定义为/mysql/data/mysql01.pid。但不管哪一种状况,functions中的__pids_var_run
函数均可以处理。
pid文件中可能有多行,表示多实例。
每一个进程都必有一个pid,但并不必定都记录在pid文件中,例如线程的pid。但不管如何,在/proc/目录下,必定会有pid号命名的目录,只要有对应pid号的目录,就表示该进程已经在运行。函数checkpid
专门检测给定的pid值在/proc下是否有对应的目录存在。
为了获取进程名的pid值,此处函数__pids_pidof
使用的是pidof
命令。该命令专门设计用来在脚本中取给定进程的pid。它的"-o"选项用于忽略某些进程号,在脚本中应用时常被忽略的是调用pidof的shell的PID,当前shell的PID以及父shell的pid。总之,该函数的目的就是为了获取合理无误的进程pid。
如下是函数checkpid
、__pids_var_run
和__pids_pidof
的定义语句。
# Check if any of $pid (could be plural) are running
checkpid() {
local i
for i in $* ; do # 检测/proc目录下是否存在给定的进程目录
[ -d "/proc/$i" ] && return 0
done
return 1
}
# __proc_pids {program} [pidfile]
# Set $pid to pids from /var/run* for {program}. $pid should be declared
# local in the caller.
# Returns LSB exit code for the 'status' action.
__pids_var_run() { # 经过检测pid判断程序是否已在运行
local base=${1##*/} # 获取进程名的basename
local pid_file=${2:-/var/run/$base.pid} # 定义pid文件路径
pid=
if [ -f "$pid_file" ] ; then # 给定的pid文件是否存在
local line p
[ ! -r "$pid_file" ] && return 4 # "user had insufficient privilege"
while : ; do # 将pid文件中的pid值(可能有多行)赋值给pid变量
read line
[ -z "$line" ] && break
for p in $line ; do
[ -z "${p//[0-9]/}" ] && [ -d "/proc/$p" ] && pid="$pid $p"
done
done < "$pid_file"
if [ -n "$pid" ]; then # pid存在,则返回0。不然表示pid文件存在,但/proc下没有对应命令
return 0 # 即进程已死,但pid文件却存在,返回状态码1。
fi
return 1 # "Program is dead and /var/run pid file exists"
fi
return 3 # "Program is not running" # pid文件不存在时,表示进程未运行,返回状态码3
}
# Output PIDs of matching processes, found using pidof
__pids_pidof() { # 下面的pidof命令的意义见稍后解释
pidof -c -m -o $$ -o $PPID -o %PPID -x "$1" || \ # 忽略当前shell的PID,父shell的pid和
# 调用pidof程序的shell的pid
pidof -c -m -o $$ -o $PPID -o %PPID -x "${1##*/}" # 总之就是找出合理的pid
}
从__pidsvar_run
函数的定义语句中能够了解到,只有当pid文件存在,且/proc下有pid对应的目录时,才表示进程在运行(固然,线程没有pid文件)。__pids_var_run
函数调用方法:
__pids_var_run program [pidfile]
若是不给定pidfile,则默认为/var/run/$base.pid文件。函数的执行结果为4种状态码:
除了返回状态码,__pids_var_run
函数还会保存变量pid的结果,以供其余程序引用。
__pids_pidof
中使用了pidof命令,其中使用了几个"-o"选项,它用于忽略指定的pid。但看上去"$$""$PPID""%PPID"不是很好理解。"-o $$"是忽略的是shell进程,大多数时候它会继承父shell的pid,但在脚本中时它表明的是脚本所在shell的pid。"-o $PPID"忽略的是父shell。"-o %PPID"忽略的是调用pidof命令的shell。不是很好理解,能够参考下面的测试语句。
测试脚本:
#!/bin/bash
echo 'pidof bash: '`pidof bash`
echo 'script shell pid: '`echo $$`
echo 'script parent shell pid: '`echo $PPID`
echo 'pidof -o $$ bash: '`pidof -o $$ bash`
echo 'pidof -o $PPID bash: '`pidof -o $PPID bash`
echo 'pidof -o %PPID bash: '`pidof -o %PPID bash`
echo 'pidof -o $$ -o $PPID -o %PPID bash: '`pidof -o $$ -o $PPID -o %PPID bash`
测试语句:
[root@xuexi ~]# pidof bash
3306 2436 2302
[root@xuexi ~]# (echo 'parent shell: '$$;echo "current bash pid: `pidof bash`";./test.sh)|cat -n
1 parent shell: 2302
2 current bash pid: 3745 3306 2436 2302
3 pidof bash: 3748 3745 3306 2436 2302
4 script shell pid: 3748
5 script parent shell pid: 3745
6 pidof -o $$ bash: 3745 3306 2436 2302
7 pidof -o $PPID bash: 3748 3306 2436 2302
8 pidof -o %PPID bash: 3745 3306 2436 2302
9 pidof -o $$ -o $PPID -o %PPID bash: 3306 2436 2302
第一个pidof命令:说明当前已有3个bash,pid为:330六、2436和2302。
第二个命令:
除了以上3个pid相关函数,functions文件中,还提供了两个函数pidfileofproc
和pidofproc
,均用于获取给定程序的pid值。
如下是pidfileofproc函数的定义语句。注意,该函数不是获取pidfile,而是获取pid值。
# A function to find the pid of a program. Looks *only* at the pidfile
pidfileofproc() {
local pid
# Test syntax.
if [ "$#" = 0 ] ; then
echo $"Usage: pidfileofproc {program}"
return 1
fi
__pids_var_run "$1" # 不提供pidfile,所以认为是/var/run/$base.pid
[ -n "$pid" ] && echo $pid
return 0
}
所以,pidfileofproc
函数只能获取/var/run下的pid。
如下是pidofproc函数的定义语句:
# A function to find the pid of a program.
pidofproc() {
local RC pid pid_file=
# Test syntax.
if [ "$#" = 0 ]; then
echo $"Usage: pidofproc [-p pidfile] {program}"
return 1
fi
if [ "$1" = "-p" ]; then # 既能够获取/var/run/$base.pid中的pid,
pid_file=$2 # 也能够获取自给定pid文件中的pid
shift 2
fi
fail_code=3 # "Program is not running"
# First try "/var/run/*.pid" files
__pids_var_run "$1" "$pid_file"
RC=$?
if [ -n "$pid" ]; then # $pid不为空时,输出program的pid值
echo $pid
return 0
fi
[ -n "$pid_file" ] && return $RC # $pid为空,但使用了"-p"指定pidfile时,返回$RC。
__pids_pidof "$1" || return $RC # $pid为空,且$pidfile为空时,获取进程号pid并输出
}
这两个函数的区别在于pidfileofproc只能搜索/var/run下的pid,而pidofproc能够搜索自给定的pidfile或/var/run/下的pid。而前面的__pids_pidof
函数,只有在获取bash进程时更精确(由于它会忽略父shell进程)。至于选哪个,见文末总结。
这两个函数用的比较少,但确实有使用它的脚本。如crond启动脚本中借助pidfileofproc来杀进程:
echo -n $"Stopping $prog: "
if [ -n "`pidfileofproc $exec`" ]; then
killproc $exec
RETVAL=3
else
failure $"Stopping $prog"
fi
dnsbind的named服务启动脚本中借助pidofproc来判断进程是否已在运行。
pidofnamed() {
pidofproc -p "$ROOTDIR$PIDFILE" "$named";
}
if [ -n "`pidofnamed`" ]; then
echo -n $"named: already running"
success
echo
exit 0;
fi;
daemon函数用于启动一个程序,并根据结果输出success或failure。
定义语句以下:
# A function to start a program.
daemon() {
# Test syntax.
local gotbase= force= nicelevel corelimit # 定义一大堆变量
local pid base= user= nice= bg= pid_file=
local cgroup=
nicelevel=0
while [ "$1" != "${1##[-+]}" ]; do # 当参数$1以"-"或"+"开头时进入循环,但$1为空时也知足
case $1 in
'') echo $"$0: Usage: daemon [+/-nicelevel] {program}" "[arg1]..."
return 1;;
--check) # daemon接受"--arg value"和"--arg=value"两种格式的参数
base=$2
gotbase="yes"
shift 2
;;
--check=?*)
base=${1#--check=}
gotbase="yes"
shift
;;
--user)
user=$2
shift 2
;;
--user=?*)
user=${1#--user=}
shift
;;
--pidfile)
pid_file=$2
shift 2
;;
--pidfile=?*)
pid_file=${1#--pidfile=}
shift
;;
--force)
force="force"
shift
;;
[-+][0-9]*)
nice="nice -n $1"
shift
;;
*) echo $"$0: Usage: daemon [+/-nicelevel] {program}" "[arg1]..."
return 1;;
esac
done
# Save basename.
[ -z "$gotbase" ] && base=${1##*/} # 若未传递"--check",则此处获取bashname
# See if it's already running. Look *only* at the pid file.
__pids_var_run "$base" "$pid_file"
[ -n "$pid" -a -z "$force" ] && return # 如进程已在运行(已检测出pid),且没有使用force
# 强制启动,则退出daemon函数
# make sure it doesn't core dump anywhere unless requested
corelimit="ulimit -S -c ${DAEMON_COREFILE_LIMIT:-0}" # corelimit、cgroup和资源控制有关,忽略它
# if they set NICELEVEL in /etc/sysconfig/foo, honor it
[ -n "${NICELEVEL:-}" ] && nice="nice -n $NICELEVEL"
# if they set CGROUP_DAEMON in /etc/sysconfig/foo, honor it
if [ -n "${CGROUP_DAEMON}" ]; then
if [ ! -x /bin/cgexec ]; then
echo -n "Cgroups not installed"; warning
echo
else
cgroup="/bin/cgexec";
for i in $CGROUP_DAEMON; do
cgroup="$cgroup -g $i";
done
fi
fi
# Echo daemon
[ "${BOOTUP:-}" = "verbose" -a -z "${LSB:-}" ] && echo -n " $base"
# And start it up. # 启动程序。runuser的"-s"指定执行程序的shell,$user指定运行的身份
# "$*"是剔除掉daemon选项后程序的启动指令。
if [ -z "$user" ]; then
$cgroup $nice /bin/bash -c "$corelimit >/dev/null 2>&1 ; $*"
else
$cgroup $nice runuser -s /bin/bash $user -c "$corelimit >/dev/null 2>&1 ; $*"
fi
[ "$?" -eq 0 ] && success $"$base startup" || failure $"$base startup"
}
daemon函数调用方法:
daemon [--check=servicename] [--user=USER] [--pidfile=PIDFILE] [--force] program [prog_args]
须要注意的是:
例如httpd的启动脚本中。
echo -n $"Starting $prog: "
daemon --pidfile=${pidfile} $httpd $OPTIONS
这样的语句的执行结果大体以下:
[root@xuexi ~]# service httpd start Starting httpd: [ OK ]
还需注意,一般program的运行参数可能也是"--"开头的,要和program前面的选项区分。例如:
daemon --pidfile $pidfile --check $servicename $processname --pid-file=$pidfile
第二个"--pid-file"是"$processname"的运行参数,第一个"--pidfile"是daemon检测"$processname"是否已运行的选项。因为提供了"--check $servicename",因此函数调用语句__pids_var_run $base [pidfile]
中的$base等于$servicename,即表示检查$servicename进程是否容许。若是没有提供该选项,则检查的是$processname。
至此,daemon函数已经分析完成。实际上很简单,就是为daemon提供几个选项,再提供要执行的命令,并为该命令提供启动参数。
killproc函数的做用是根据给定程序名杀进程。中间它会获取程序名对应的pid号,且保证/proc目录下没有pid对应的目录才表示进程关闭成功。
# A function to stop a program.
killproc() {
local RC killlevel= base pid pid_file= delay try
RC=0; delay=3; try=0
# Test syntax.
if [ "$#" -eq 0 ]; then
echo $"Usage: killproc [-p pidfile] [ -d delay] {program} [-signal]" return 1 fi if [ "$1" = "-p" ]; then # 指定pid_file。不给"-p"时,"__pids_var_run"将检查/var/run下的文件 pid_file=$2 shift 2 fi if [ "$1" = "-d" ]; then # awk的多目运算符。delay的有效值单位为d(天)、时(h)、分(m)、秒(s)。 # 不写单位时默认为秒。该语句将所给时间转换成秒,接受小数,作四舍五入计算 delay=$(echo $2 | awk -v RS=' ' -v IGNORECASE=1 '{if($1!~/^[0-9.]+[smhd]?$/) exit 1;d=$1~/s$|^[0-9.]*$/?1:$1~/m$/?60:$1~/h$/?60*60:$1~/d$/?24*60*60:-1;if(d==-1) exit 1;delay+=d*$1} END {printf("%d",delay+0.5)}') if [ "$?" -eq 1 ]; then echo $"Usage: killproc [-p pidfile] [ -d delay] {program} [-signal] return 1 fi shift 2 fi # check for second arg to be kill level [ -n "${2:-}" ] && killlevel=$2 # 获取稍后的kill程序将要发送的信号 # Save basename. base=${1##*/} # Find pid. # 获取program的pid号,以让kill程序杀掉 __pids_var_run "$1" "$pid_file" # 检查program是否已有对应pid文件,并返回pidfile中全部pid值 RC=$? if [ -z "$pid" ]; then if [ -z "$pid_file" ]; then pid="$(__pids_pidof "$1")" # pid为空,且没有pidfile时,获取program的pid else [ "$RC" = "4" ] && { failure $"$base shutdown" ; return $RC ;} fi fi # Kill it. # 根据pid,杀掉已存在的进程 if [ -n "$pid" ] ; then # 若是进程pid存在,则杀死它 [ "$BOOTUP" = "verbose" -a -z "${LSB:-}" ] && echo -n "$base "
if [ -z "$killlevel" ] ; then # 没有指定要传递的信号时
if checkpid $pid 2>&1; then # 给定pid在/proc目录中是否有对应目录
# TERM first, then KILL if not dead
kill -TERM $pid >/dev/null 2>&1 # 先发送TERM信号
usleep 50000
if checkpid $pid ; then # 0.5秒后还没死透,则
try=0
while [ $try -lt $delay ] ; do # 在给定delay时间内不断检测是否已死
checkpid $pid || break
sleep 1
let try+=1
done
if checkpid $pid ; then # 超出delay后,发送KILL信号强制杀死
kill -KILL $pid >/dev/null 2>&1
usleep 50000
fi
fi
fi
checkpid $pid # 若/proc下还有pid对应的目录,则进程关闭失败
RC=$?
[ "$RC" -eq 0 ] && failure $"$base shutdown" || success $"$base shutdown"
RC=$((! $RC))
# use specified level only
else # 使用指定的信号杀进程
if checkpid $pid; then
kill $killlevel $pid >/dev/null 2>&1
RC=$?
[ "$RC" -eq 0 ] && success $"$base $killlevel" || failure $"$base $killlevel"
elif [ -n "${LSB:-}" ]; then
RC=7 # Program is not running
fi
fi
else # 若是进程pid不存在,表示未运行
if [ -n "${LSB:-}" -a -n "$killlevel" ]; then
RC=7 # Program is not running
else
failure $"$base shutdown" RC=0 fi fi # Remove pid file if any. if [ -z "$killlevel" ]; then # 未给定信号时,可能KILL信号强杀时使得pid文件还存在,手动移除它 rm -f "${pid_file:-/var/run/$base.pid}" fi return $RC }
根据此脚本,能够知道关闭进程时,须要再三肯定pid文件是否存在,/proc下是否有和pid对应的目录。直到/proc下已经没有了和pid对应的目录时,才表示进程真正杀死了。但此时pid文件仍可能存在,所以还要保证pid文件已被移除。
该函数的调用方法:
killproc [-p pidfile] [ -d delay] {program} [-signal]
status函数用于获取进程的运行状态,有如下几种状态:
如下的status函数定义语句。注意,此为CentOS 7上语句,比CentOS 6多了一段systemctl的处理,用于Sysv的status状态向systemd的status状态转换。
status() {
local base pid lock_file= pid_file=
# Test syntax.
if [ "$#" = 0 ] ; then
echo $"Usage: status [-p pidfile] {program}"
return 1
fi
if [ "$1" = "-p" ]; then
pid_file=$2 # 指定pidfile
shift 2
fi
if [ "$1" = "-l" ]; then
lock_file=$2 # 指定lockfile
shift 2
fi
base=${1##*/}
if [ "$_use_systemctl" = "1" ]; then
systemctl status ${0##*/}.service
ret=$?
# LSB daemons that dies abnormally in systemd looks alive in
# systemd's eyes due to RemainAfterExit=yes
# lets adjust the reality a little bit
if systemctl show -p ActiveState ${0##*/}.service | grep -q '=active$' && \
systemctl show -p SubState ${0##*/}.service | grep -q '=exited$' ; then
ret=3
fi
return $ret
fi
# First try "pidof"
__pids_var_run "$1" "$pid_file" # 根据给定的pidfile获取program的pid,并返回pid值
RC=$?
if [ -z "$pid_file" -a -z "$pid" ]; then # pid为空,且没有pidfile时,获取program的pid
pid="$(__pids_pidof "$1")"
fi
if [ -n "$pid" ]; then # pid存在,则返回程序正在运行
echo $"${base} (pid $pid) is running..."
return 0
fi
case "$RC" in
0)
echo $"${base} (pid $pid) is running..."
return 0
;;
1) # program进程已死。pid文件存在,但/proc目录下没有对应的文件。
echo $"${base} dead but pid file exists"
return 1
;;
4) # pid文件不可读,错误
echo $"${base} status unknown due to insufficient privileges."
return 4
;;
esac
if [ -z "${lock_file}" ]; then
lock_file=${base}
fi
# See if /var/lock/subsys/${lock_file} exists
if [ -f /var/lock/subsys/${lock_file} ]; then # 检查/var/lock/subsys下是否有lockfile
echo $"${base} dead but subsys locked" # pid不存在,但锁文件存在时
return 2
fi
echo $"${base} is stopped" # 以上都不知足时,表示程序未运行
return 3
}
函数调用方法:
status [-p pidfile] [-l lockfile] program
因为函数定义缘由,若是同时提供"-p"和"-l"选项,"-l"选项必须放在"-p"的后面。
functions文件重要的东西差很少都介绍了,还有些无所谓的东西就忽略它们好了。看完这么多分析,确定会晕头转向,因此给个总结。至于前面几个简单的函数echo_success
、echo_failure
、echo_passed
、echo_warning
、success
、failure
、passed
、warning
、action
、confirm
、is_true
、is_false
就懒的总结了,用法都很简单。
checkpid
:检查/proc下是否有给定pid对应的目录,不管给定多少个pid,只要有一个有目录,都返回0。调用方法:checkpid pid_list
[root@xuexi ~]# source /etc/init.d/functions
[root@xuexi ~]# sleep 10 & a="$!";sleep 10 & a="$a $!";sleep 10 & a="$a $!";checkpid $a
[root@xuexi ~]# echo $?
0
__pids_var_run
:检查pid是否存在,并保存到变量pid中,同时返回几种进程状态码。这个函数很是重要,不只从pidfile中获取并保存pid号码,还根据状况返回几种状态码,这几个状态码是status函数的重要依据。在SysV服务启动脚本中使用很是普遍。
调用方法:__pids_var_run program [pidfile]
如下是httpd进程的测试结果。分别是指定pid文件和不指定pid文件的状况。
[root@xuexi ~]# service httpd start
[root@xuexi ~]# __pids_var_run httpd /var/run/httpd/httpd.pid
[root@xuexi ~]# echo $?
0
[root@xuexi ~]# echo $pid
4863
[root@xuexi ~]# __pids_var_run httpd # 不指定pidfile时,将搜索/var/run/httpd.pid
[root@xuexi ~]# echo $?
3
[root@xuexi ~]# echo $pid # 每次调用该函数Pid会重置
[root@xuexi ~]#
__pids_pidof
:获取进程pid。pidfileofproc
:获取进程的pid。但只能获取/var/run下的pid文件中的值。pidofproc
:获取进程的pid。可获取任意给定pidfile或默认/var/run下pidfile中的值。都是获取进程pid,第一个函数和后两个的区别主要在于获取的pid是bash进程时更精确,第二个和第三个函数的区别在于第2个函数只能获取/var/run下pid文件中的pid值。
[root@xuexi ~]# service httpd restart
[root@xuexi ~]# pidfileofproc httpd
[root@xuexi ~]# pidofproc httpd
4872 4871 4870 4869 4868 4867 4866 4865 4863
[root@xuexi ~]# __pids_pidof httpd
4872 4871 4870 4869 4868 4867 4866 4865 4863
上面pidfileofproc命令没有任何结果,由于httpd的pid文件为/var/run/httpd/httpd.pid,而非/var/run/httpd.pid。
若是将httpd的pid路径修改成/var/run/httpd.pid,再看它们的结果。
[root@xuexi ~]# service httpd stop
[root@xuexi ~]# sed -i "s%^PidFile.*%PidFile /var/run/httpd.pid%" /etc/httpd/conf/httpd.conf
[root@xuexi ~]# sed -i 's%^#PIDFILE.*%PIDFILE=/var/run/httpd.pid%' /etc/sysconfig/httpd
[root@xuexi ~]# service httpd start
[root@xuexi ~]# ls /var/run/httpd*
/var/run/httpd.pid
/var/run/httpd:
再看它们搜索到的pid以及进程列表中httpd的pid和pid文件中的pid。
[root@xuexi ~]# __pids_pidof httpd
6235 6234 6233 6232 6231 6230 6229 6228 6226
[root@xuexi ~]# pidofproc httpd
6226
[root@xuexi ~]# pidfileofproc httpd
6226
[root@xuexi ~]# ps aux | grep http[d]
root 6226 0.0 0.3 177844 3892 ? Ss 12:14 0:00 /usr/sbin/httpd
apache 6228 0.0 0.2 177844 2532 ? S 12:14 0:00 /usr/sbin/httpd
apache 6229 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6230 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6231 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6232 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6233 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6234 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
apache 6235 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd
[root@xuexi ~]# cat /var/run/httpd.pid
6226
因此,要使用这3个函数中的哪个?若是要找出进程的"master"进程号,例如要向主进程发送HUP信号reload配置文件时,应该用pidofproc并使用"-p"指定pid文件。其他时候用__pids_pidof
准没错,也正是如此,在daemon和killproc函数中都使用了它。另外,在多实例的状况下,也能够考虑使用pidofproc
来根据pidfile搜索对应实例的pid。
daemon
:启动一个服务程序。在启动前还检查是否已在运行。调用方式:
daemon [--check=servicename] [--user=USER] [--pidfile=PIDFILE] [--force] program [prog_args]
"--user"用于指定进程运行身份,"--check"和"--pidfile"用于指定检查进程是否已在运行,"--force"表示即便在运行也一样再启动一个程序。prog_args用于为program程序提供启动参数。
通常daemon会配合如下几个语句同时执行,这正是SysV脚本的一个特色。
echo -n $"Starting $prog: "
daemon --pidfile=${pidfile} $prog $OPTIONS
RETVAL=$?
[ $RETVAL = 0 ] && touch ${lockfile}
return $RETVAL
注意,daemon函数启动程序时,自身就会调用success或failure函数,因此就不需再使用action函数了。若是不使用daemon函数启动服务,一般会配合action函数。例如:
$prog $OPTIONS
RETVAL=$?
[ $RETVAL -eq 0 ] && action "Starting $prog" /bin/true && touch ${lockfile}
killproc
:杀掉给定的服务进程。函数调用方式:
killproc [-p pidfile] [-d delay] program [-signal]
"-p pidfile":选项用于指定今后文件中获取进程的pid号,不指定时默认从/var/run/$base.pid中获取。
"-signal":用于指定kill发送的信号。若是不指定,则默认先发送TERM信号,在"-d delay"时间段内仍不断检测是否进程已经被杀死,若是还未死透,则delay超时后发送KILL信号强制杀死。
"-d delay":指定未使用"-signal"时的延迟检测时间。有效单位为秒、分、时、日("smhd"),不写时默认为秒。
须要明确的是,只有/proc目录下没有了pid对应的目录才算是杀死了。
通常来讲,killproc前会判断进程是否已在运行,最后还要删除pid文件和lock文件。固然,killproc函数能够保证pid文件被删除。因此,killproc函数大体会同时配合如下语句用来杀进程:
status -p ${pidfile} $prog > /dev/null
if [[ $? = 0 ]]; then
echo -n $"Stopping $prog: "
killproc -p ${pidfile} -d ${STOP_TIMEOUT} $httpd
else
echo -n $"Stopping $prog: "
success
fi
RETVAL=$?
[ $RETVAL -eq 0 ] && rm -f ${lockfile} ${pidfile}
一样注意,killproc中已经自带success和failure函数。若是不使用killproc杀进程,则一般会配合action函数或者success、failure。大体以下:
killall $prog ; usleep 50000 ; killall $prog
RETVAL=$?
if [ "RETVAL" -ne 0 ];then
action $"Stopping $prog: " /bin/true
rm -rf ${lockfile} ${pidfile}
else
action $"Stoping $prog: " /bin/false
fi
以上因为采用的是killall命令,若是采用的是kill命令,则须要先获取进程的pid,在此以前还要检查pid文件是否存在。
status
:检查给定进程的运行状态。用于返回进程状态。调用方式:注意"-p"必须在"-l"前面
status [-p pidfile] [-l lockfile] program
共有 如下几种状态:
如下是memcached服务启动脚本的示例,是一个很是简单但却很是通用的Sysv服务启动脚本。
#!/bin/bash
#
# chkconfig: - 86 14
# description: Distributed memory caching daemon
## Default variables
PORT="11211"
USER="nobody"
MAXCONN="1024"
CACHESIZE="64"
OPTIONS=""
RETVAL=0
prog="/usr/local/memcached/bin/memcached"
desc="Distributed memory caching"
lockfile="/var/lock/subsys/memcached"
. /etc/rc.d/init.d/functions
[ -f /etc/sysconfig/memcached ] && source /etc/sysconfig/memcached
start() {
echo -n $"Starting $desc (memcached): "
daemon $prog -d -p $PORT -u $USER -c $MAXCONN -m $CACHESIZE "$OPTIONS"
RETVAL=$?
echo
[ $RETVAL -eq 0 ] && touch $lockfile
return $RETVAL
}
stop() {
echo -n $"Shutting down $desc (memcached): "
killproc $prog
RETVAL=$?
echo
[ $RETVAL -eq 0 ] && rm -f $lockfile
return $RETVAL
}
restart() {
stop
start
}
reload() {
echo -n $"Reloading $desc ($prog): "
killproc $prog -HUP
RETVAL=$?
echo
return $RETVAL
}
case "$1" in
start)
start
;;
stop)
stop
;;
restart)
restart
;;
condrestart)
[ -e $lockfile ] && restart
RETVAL=$?
;;
reload)
reload
;;
status)
status $prog
RETVAL=$?
;;
*)
echo $"Usage: $0 {start|stop|restart|reload|condrestart|status}"
RETVAL=1
esac
exit $RETVAL
另请参考:如何写SysV服务管理脚本。