本文介绍一种在Linux系统下为实现某些关键进程状态的实时监控而使用shell脚本的编写方法。在这里主要通过监控某些进程是否退出作为判断依据,如果某个进程退出了,则进行对应的恢复处理,如重新拉起相关的进程等。

下面介绍该脚本的实现流程。

首先生成一个名为”process_check.sh”的脚本,脚本内容如下:

#!/bin/bash
#该函数检查关键进程的状态,最终返回进程的个数。
checkprocess()
{
#       echo "checkprocess...$1"
if [ "$1" = "" ];
then
return 1
fi
process_num=`ps -ef|grep "$1" |grep -v "grep" |wc -l`
#       echo "checkprocess num=$process_num"
return $process_num
}
#进程如有退出,则记录相关的信息,并做相关的处理
recordinfo()
{
#       echo "check $1"
if [ "$1" = "" ];
then
return
fi
#打印进程退出的时间
date "+++++++++++++++++++ +%Y-%m-%d %H:%M:%S '$1' exit! +++++++++++++++++++"
#重新拉起这个进程
"$1" &
echo "restart $1"
}
#检查进程的状态
check()
{
echo "####check $1"
if [ "$1" = "" ];
then
return
fi
checkprocess "$1"
check_result=$?
#如果该进程的个数为0,则说明该进程已经退出
if [ $check_result -eq 0 ];
then
recordinfo "$1"
#               exit
fi
}
#循环检测
while [ 1 ] ; do
#关键进程列表,多个进程以逗号分隔,这里以两个进程为例子。
process_name="./test1,./test2"
OLD_IFS="$IFS"
IFS=","
arr=($process_name)
IFS="$OLD_IFS"
for s in ${arr[@]}
do
check "$s"
done
sleep 3
#       echo "check loop..."
done

测试验证

这里写一个简单的测试程序,代码如下:

void main()
{
while(1) {
sleep(3);
}
}

编译后生成两个名为“test1”,“test2”的可执行文件。

为了方便测试,可以将”process_check.sh”,”test1”,”test2”放置于同一个目录下。

  1. 运行”process_check.sh”,如下所示:

Linux下使用Shell脚本实现进程监控

从上图可知,”test1”,”test2”刚开始并未被拉起,运行”process_check.sh”之后,检测出”test1”,”test2”不存在,则触发拉起的机制,最终”test1”,”test2”被启动了。

  1. 运行过程中kill掉某一个进程,验证”process_check.sh”是否有将该进程拉起。

Linux下使用Shell脚本实现进程监控

由下图可知,被kill的进程最终又被拉起了。

Linux下使用Shell脚本实现进程监控

至此,该脚本的功能已被验证完毕。

结语:在 Linux 平台下,shell 脚本监控是一个非常简单、方便的工具,它可以有效的对服务器、进程进行监控,对系统开发以及进程维护人员非常有帮助。

发表回复