May
20
我管理服务器太多了,不可能每时每刻都登录到上面查看服务器状况,于是写了一个“服务器监控系统 ServMon V1.0”。其原理是用shell脚本定时抓取被监控服务器上信息,再用curl POST到监控机的PHP接口程序上,由PHP接口程序对信息进行分析,如果存在异常,则发送报警邮件给管理员。
下午,ServMon V1.0 已经在sina播客服务器上部署,以下为ServMon的删节版内容,只监控磁盘分区使用率和Swap交换空间两项:
1、被监控端服务器的shell脚本(Linux)
(1)、发送磁盘分区使用率给监控端接口http://192.168.0.28/servmon/interface.php的脚本
磁盘分区使用率监控报警邮件示例图:
(2)、发送Swap交换空间使用率给监控端接口http://192.168.0.28/servmon/interface.php的脚本
/usr/local/servmon/bin/swapstat_send
Swap交换空间使用率监控报警邮件示例图:
(3)、计划任务:每30分钟将磁盘分区使用率发送给监控端接口,每10分钟将Swap交换空间使用率发送给监控端接口。
/etc/cron.d/servmon
2、监控端服务器配置(Linux)
(1)、启动sendmail
/usr/sbin/sendmail -bd -q30m
-b:指定Sendmail在后台运行,并且监听端口25的请求。
-d:指定Sendmail以Daemon方式运行(守护进程)。
-q:当Sendmail无法将邮件成功地发送到目的地时,它会将邮件保存在队列里。该参数指定邮件在队列里保存的时间。其中的30m表示保留30分钟。
(2)、修改php.ini的[mail function]部分为以下内容,然后重启Apache,使PHP能够使用mail()函数发送电子邮件
(4)、在MySQL上创建一个数据库servmon,然后在该数据库中执行以下SQL语句创建表:
备注:这张表是PHP接口程序用来记录发送磁盘分区报警邮件的时间,避免在一段时间内重复发送大量报警邮件的,其实完全可以用Session、文本文件来代替它。这里之所以用MySQL数据库,是因为PHP接口中还将增加一些需要记录信息到数据库的监控模块,所以就统一用数据库了。)
(3)、PHP接口程序
http://192.168.0.28/servmon/interface.php
/**
*********************************************************************
* Copyright (c) 2007, 回忆未来[张宴]
* All rights reserved.
*
* 文件名称: interface.php
* 摘 要: 服务器监控系统ServMon接口程序
* 描 述:
* 作 者: 张宴 新浪UC:103500 博客:blog.s135.com
* 版 本: 1.0
* 时 间: 2007-08-03
*********************************************************************
*/
//------------------配置信息------------------
$password = "yourpassword";//设置数据传输验证密码
$mysql_server = "127.0.0.1:3306";//MySQL服务器地址及端口,例如localhost:3306
$mysql_db = "servmon";//MySQL数据库名
$mysql_username = "root";//MySQL帐号
$mysql_password = "";//MySQL密码
$disk_max = "90";//磁盘分区使用百分比超过此值,则报警。默认为90%
$disk_sendmail_interval = "43200";//如果同一台服务器连续报警,设置每隔多少秒发送一次报警邮件。默认为43200秒,即12小时。
$swap_max = "50";//Swap交换空间使用百分比超过此值,则报警。默认为50%
$email = "[email protected]";//管理员邮箱
//--------------------------------------------
//密码验证
if (htmlspecialchars($_POST["password"]) != $password)
{
echo "数据传输验证密码错误!\n";
exit();
}
//磁盘分区报警(分区使用率超过90%后会发邮件报警)
if (htmlspecialchars($_POST["menu"]) == "diskstat")
{
$is_send_mail = "0";//是否发邮件,0为不发邮件
$date = htmlspecialchars($_POST["date"]);
$ip = htmlspecialchars($_POST["ip"]);
$data = htmlspecialchars($_POST["data"]);
$subject = "[系统监控]_磁盘分区空间不足_" . $ip;
$message = "服务器监控系统 ServMon V1.0\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警服务器:" . $ip . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警时间:" . $date . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警内容:\r\n";
$headers = 'From: ServMon' . "\r\n" .
'Reply-To: ServMon' . "\r\n" . 'X-Mailer: PHP/' . phpversion();
$arr1 = explode(";", $data);
foreach ($arr1 as $key1 => $value1)
{
$arr2 = explode(":", $value1);
if ($arr2[0] != "" && $arr2[1] != "" && $arr2[1] >= $disk_max)
{
$message = $message . "●磁盘分区 " . $arr2[0] . " 空间不足(空间使用率达到" . $arr2[1] . "%)\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
}
if ($is_send_mail == "1")
{
$connect = mysql_connect($mysql_server, $mysql_username, $mysql_password);
$select = mysql_select_db($mysql_db, $connect);
$select_result = mysql_query("SELECT date FROM tb_diskstat WHERE ip='" . $ip .
"' LIMIT 1");
$rs = mysql_fetch_array($select_result);
$interval = date("U") - $rs["date"];
if ($interval >= $disk_sendmail_interval)
{
if (mail($email, $subject, $message, $headers))
{
echo "已成功发送报警邮件!\n";
}
else
{
echo "发送报警邮件失败!\n";
}
$insert_result = mysql_query("REPLACE INTO tb_diskstat (ip, date) VALUES ('" . $ip .
"', '" . date("U") . "');");
}
else
{
if ($disk_sendmail_interval >= 3600)
{
$disk_sendmail_interval_text = $disk_sendmail_interval / 3600 . "小时";
}
else
{
$disk_sendmail_interval_text = $disk_sendmail_interval . "秒";
}
echo "已发送过报警邮件," . $disk_sendmail_interval_text . "内不再重复发送!\n";
}
}
else
{
echo "磁盘分区空间足够,无须发送报警邮件!\n";
}
exit();
}
//Swap交换空间报警(Swap交换空间使用率超过60%后会发邮件报警)
if (htmlspecialchars($_POST["menu"]) == "swapstat")
{
$is_send_mail = "0";//是否发邮件,0为不发邮件
$date = htmlspecialchars($_POST["date"]);
$ip = htmlspecialchars($_POST["ip"]);
list($total, $used, $free) = split(":", htmlspecialchars($_POST["data"]));
$percentage = round($used / $total * 100, 0);
$subject = "[系统监控]_Swap交换空间使用率高达" . $percentage . "%_" . $ip;
$message = "服务器监控系统 ServMon V1.0\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警服务器:" . $ip . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警时间:" . $date . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警内容:\r\n";
$headers = 'From: ServMon' . "\r\n" .
'Reply-To: ServMon' . "\r\n" . 'X-Mailer: PHP/' . phpversion();
$arr1 = explode(";", $data);
foreach ($arr1 as $key1 => $value1)
{
$arr2 = explode(":", $value1);
if ($arr2[0] != "" && $arr2[1] != "" && $arr2[1] >= $disk_max)
{
$message = $message . "●磁盘分区 " . $arr2[0] . " 空间不足(空间使用率达到" . $arr2[1] . "%)\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
}
if ($percentage >= $swap_max)
{
$message = $message . "●Swap交换空间使用率高达" . $percentage . "%,若继续增加到100%可能会导致服务器死机。\r\n";
$message = $message . "●Swap交换空间总量:" . $total . " MB\r\n";
$message = $message . "●Swap交换空间使用:" . $used . " MB\r\n";
$message = $message . "●Swap交换空间剩余:" . $free . " MB\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
if ($is_send_mail == "1")
{
if (mail($email, $subject, $message, $headers))
{
echo "已成功发送报警邮件!\n";
}
else
{
echo "发送报警邮件失败!\n";
}
}
else
{
echo "Swap交换空间使用率不高,无须发送报警邮件!\n";
}
exit();
}
?>
文章来源:http://blog.s135.com/post/276/
下午,ServMon V1.0 已经在sina播客服务器上部署,以下为ServMon的删节版内容,只监控磁盘分区使用率和Swap交换空间两项:
1、被监控端服务器的shell脚本(Linux)
(1)、发送磁盘分区使用率给监控端接口http://192.168.0.28/servmon/interface.php的脚本
引用
/usr/local/servmon/bin/diskstat_send
#!/bin/sh
LANG=zh_cn
disk=$(/bin/df -kP | grep / | awk -F ' ' ' {print $6":"$5}' | awk -F '%' ' {print $1}' | tr -s '\n' ';')
today=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")
ip=$(/sbin/ifconfig | grep "inet addr" | grep -v "127.0.0.1" | awk '{print $2;}' | awk -F':' '{print $2;}' | tr -s '\n' ';')
/usr/bin/curl -d menu=diskstat -d password=$2 -d date=$today -d ip=$ip -d data=$disk $1
#!/bin/sh
LANG=zh_cn
disk=$(/bin/df -kP | grep / | awk -F ' ' ' {print $6":"$5}' | awk -F '%' ' {print $1}' | tr -s '\n' ';')
today=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")
ip=$(/sbin/ifconfig | grep "inet addr" | grep -v "127.0.0.1" | awk '{print $2;}' | awk -F':' '{print $2;}' | tr -s '\n' ';')
/usr/bin/curl -d menu=diskstat -d password=$2 -d date=$today -d ip=$ip -d data=$disk $1
磁盘分区使用率监控报警邮件示例图:
(2)、发送Swap交换空间使用率给监控端接口http://192.168.0.28/servmon/interface.php的脚本
/usr/local/servmon/bin/swapstat_send
引用
#!/bin/sh
LANG=zh_cn
data=$(/usr/bin/free -m | grep Swap | awk '{print $2":"$3":"$4}')
today=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")
ip=$(/sbin/ifconfig | grep "inet addr" | grep -v "127.0.0.1" | awk '{print $2;}' | awk -F':' '{print $2;}' | tr -s '\n' ';')
/usr/bin/curl -d menu=swapstat -d password=$2 -d date=$today -d ip=$ip -d data=$data $1
LANG=zh_cn
data=$(/usr/bin/free -m | grep Swap | awk '{print $2":"$3":"$4}')
today=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")
ip=$(/sbin/ifconfig | grep "inet addr" | grep -v "127.0.0.1" | awk '{print $2;}' | awk -F':' '{print $2;}' | tr -s '\n' ';')
/usr/bin/curl -d menu=swapstat -d password=$2 -d date=$today -d ip=$ip -d data=$data $1
Swap交换空间使用率监控报警邮件示例图:
(3)、计划任务:每30分钟将磁盘分区使用率发送给监控端接口,每10分钟将Swap交换空间使用率发送给监控端接口。
/etc/cron.d/servmon
引用
0-30/30 * * * * root /bin/sh /usr/local/servmon/bin/diskstat_send http://192.168.0.28/servmon/interface.php yourpassword
0-50/10 * * * * root /bin/sh /usr/local/servmon/bin/swapstat_send http://192.168.0.28/servmon/interface.php yourpassword
0-50/10 * * * * root /bin/sh /usr/local/servmon/bin/swapstat_send http://192.168.0.28/servmon/interface.php yourpassword
2、监控端服务器配置(Linux)
(1)、启动sendmail
/usr/sbin/sendmail -bd -q30m
-b:指定Sendmail在后台运行,并且监听端口25的请求。
-d:指定Sendmail以Daemon方式运行(守护进程)。
-q:当Sendmail无法将邮件成功地发送到目的地时,它会将邮件保存在队列里。该参数指定邮件在队列里保存的时间。其中的30m表示保留30分钟。
(2)、修改php.ini的[mail function]部分为以下内容,然后重启Apache,使PHP能够使用mail()函数发送电子邮件
引用
[mail function]
; For Win32 only.
;SMTP = localhost
;smtp_port = 25
; For Win32 only.
;sendmail_from = [email protected]
; For Unix only. You may supply arguments as well (default: "sendmail -t -i").
sendmail_path = /usr/sbin/sendmail -t -i
; For Win32 only.
;SMTP = localhost
;smtp_port = 25
; For Win32 only.
;sendmail_from = [email protected]
; For Unix only. You may supply arguments as well (default: "sendmail -t -i").
sendmail_path = /usr/sbin/sendmail -t -i
(4)、在MySQL上创建一个数据库servmon,然后在该数据库中执行以下SQL语句创建表:
引用
CREATE TABLE `tb_diskstat` (
`ip` varchar(128) NOT NULL default '',
`date` int(10) NOT NULL default '0',
UNIQUE KEY `ip` (`ip`)
) TYPE=MyISAM;
`ip` varchar(128) NOT NULL default '',
`date` int(10) NOT NULL default '0',
UNIQUE KEY `ip` (`ip`)
) TYPE=MyISAM;
备注:这张表是PHP接口程序用来记录发送磁盘分区报警邮件的时间,避免在一段时间内重复发送大量报警邮件的,其实完全可以用Session、文本文件来代替它。这里之所以用MySQL数据库,是因为PHP接口中还将增加一些需要记录信息到数据库的监控模块,所以就统一用数据库了。)
(3)、PHP接口程序
http://192.168.0.28/servmon/interface.php
引用
/**
*********************************************************************
* Copyright (c) 2007, 回忆未来[张宴]
* All rights reserved.
*
* 文件名称: interface.php
* 摘 要: 服务器监控系统ServMon接口程序
* 描 述:
* 作 者: 张宴 新浪UC:103500 博客:blog.s135.com
* 版 本: 1.0
* 时 间: 2007-08-03
*********************************************************************
*/
//------------------配置信息------------------
$password = "yourpassword";//设置数据传输验证密码
$mysql_server = "127.0.0.1:3306";//MySQL服务器地址及端口,例如localhost:3306
$mysql_db = "servmon";//MySQL数据库名
$mysql_username = "root";//MySQL帐号
$mysql_password = "";//MySQL密码
$disk_max = "90";//磁盘分区使用百分比超过此值,则报警。默认为90%
$disk_sendmail_interval = "43200";//如果同一台服务器连续报警,设置每隔多少秒发送一次报警邮件。默认为43200秒,即12小时。
$swap_max = "50";//Swap交换空间使用百分比超过此值,则报警。默认为50%
$email = "[email protected]";//管理员邮箱
//--------------------------------------------
//密码验证
if (htmlspecialchars($_POST["password"]) != $password)
{
echo "数据传输验证密码错误!\n";
exit();
}
//磁盘分区报警(分区使用率超过90%后会发邮件报警)
if (htmlspecialchars($_POST["menu"]) == "diskstat")
{
$is_send_mail = "0";//是否发邮件,0为不发邮件
$date = htmlspecialchars($_POST["date"]);
$ip = htmlspecialchars($_POST["ip"]);
$data = htmlspecialchars($_POST["data"]);
$subject = "[系统监控]_磁盘分区空间不足_" . $ip;
$message = "服务器监控系统 ServMon V1.0\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警服务器:" . $ip . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警时间:" . $date . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警内容:\r\n";
$headers = 'From: ServMon
'Reply-To: ServMon
$arr1 = explode(";", $data);
foreach ($arr1 as $key1 => $value1)
{
$arr2 = explode(":", $value1);
if ($arr2[0] != "" && $arr2[1] != "" && $arr2[1] >= $disk_max)
{
$message = $message . "●磁盘分区 " . $arr2[0] . " 空间不足(空间使用率达到" . $arr2[1] . "%)\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
}
if ($is_send_mail == "1")
{
$connect = mysql_connect($mysql_server, $mysql_username, $mysql_password);
$select = mysql_select_db($mysql_db, $connect);
$select_result = mysql_query("SELECT date FROM tb_diskstat WHERE ip='" . $ip .
"' LIMIT 1");
$rs = mysql_fetch_array($select_result);
$interval = date("U") - $rs["date"];
if ($interval >= $disk_sendmail_interval)
{
if (mail($email, $subject, $message, $headers))
{
echo "已成功发送报警邮件!\n";
}
else
{
echo "发送报警邮件失败!\n";
}
$insert_result = mysql_query("REPLACE INTO tb_diskstat (ip, date) VALUES ('" . $ip .
"', '" . date("U") . "');");
}
else
{
if ($disk_sendmail_interval >= 3600)
{
$disk_sendmail_interval_text = $disk_sendmail_interval / 3600 . "小时";
}
else
{
$disk_sendmail_interval_text = $disk_sendmail_interval . "秒";
}
echo "已发送过报警邮件," . $disk_sendmail_interval_text . "内不再重复发送!\n";
}
}
else
{
echo "磁盘分区空间足够,无须发送报警邮件!\n";
}
exit();
}
//Swap交换空间报警(Swap交换空间使用率超过60%后会发邮件报警)
if (htmlspecialchars($_POST["menu"]) == "swapstat")
{
$is_send_mail = "0";//是否发邮件,0为不发邮件
$date = htmlspecialchars($_POST["date"]);
$ip = htmlspecialchars($_POST["ip"]);
list($total, $used, $free) = split(":", htmlspecialchars($_POST["data"]));
$percentage = round($used / $total * 100, 0);
$subject = "[系统监控]_Swap交换空间使用率高达" . $percentage . "%_" . $ip;
$message = "服务器监控系统 ServMon V1.0\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警服务器:" . $ip . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警时间:" . $date . "\r\n";
$message = $message . "-------------------------------------------------------\r\n";
$message = $message . "报警内容:\r\n";
$headers = 'From: ServMon
'Reply-To: ServMon
$arr1 = explode(";", $data);
foreach ($arr1 as $key1 => $value1)
{
$arr2 = explode(":", $value1);
if ($arr2[0] != "" && $arr2[1] != "" && $arr2[1] >= $disk_max)
{
$message = $message . "●磁盘分区 " . $arr2[0] . " 空间不足(空间使用率达到" . $arr2[1] . "%)\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
}
if ($percentage >= $swap_max)
{
$message = $message . "●Swap交换空间使用率高达" . $percentage . "%,若继续增加到100%可能会导致服务器死机。\r\n";
$message = $message . "●Swap交换空间总量:" . $total . " MB\r\n";
$message = $message . "●Swap交换空间使用:" . $used . " MB\r\n";
$message = $message . "●Swap交换空间剩余:" . $free . " MB\r\n";
$is_send_mail = "1";//是否发邮件,1为发送邮件
}
if ($is_send_mail == "1")
{
if (mail($email, $subject, $message, $headers))
{
echo "已成功发送报警邮件!\n";
}
else
{
echo "发送报警邮件失败!\n";
}
}
else
{
echo "Swap交换空间使用率不高,无须发送报警邮件!\n";
}
exit();
}
?>
文章来源:http://blog.s135.com/post/276/