计算机系统集中监控系统的设计
电信业务的发展处于迅猛发展的阶段,相应的各种配套计算机系统也越来越多。如何高效的维护好数量繁多、分散的计算机系统,是每个维护人员需要考虑的事情。计算机系统的传统维护模式是由维护人员定时远程登录系统去检查各个系统的运行情况、日志消息和关键进程。这种维护模式存在故障发现实时性差、人工操作产生错漏、巡检工作耗时耗力等问题。维护现状给维护人员提出了要求,那就是实时、全面、前瞻、快速的做好系统维护工作。为此提出了计算机系统集中监控系统的开发需求。通过集中监控系统,将给传统的计算机系统维护模式带来了根本性的变革,实现了从分散到集中、从被动到主动的维护模式的转变。
1计算机系统集中监控系统的系统架构
集中监控系统的系统架构主要分为告警信息处理、系统监控、系统重要信息(非告警信息)采集三大模块,为实现每个大模块的功能,每个大模块再细分成几个功能小模块,主要的功能模块有告警信息采集、翻译、发送、接收模块、用户权限管理模块、数据配置模块、分析统计模块等。
2系统总业务流程图
系统的业务流程如图1所示。
被监控主机系统上应用syslog协议,发送日志信息到采集机,采集机上的syslog消息接收程序收集到日志信息后,根据syslog协议的消息包格式把消息解析出来,再通过配置好的ODBC把解析后的消息插入数据库表中;在被监控主机系统上配置shell脚本采集性能数据和数据库信息,采集之后采用FTP的方式传送到采集机上,采集机上的告警信息翻译程序把性能数据和数据库消息翻译后,插入到数据库表中;分类模块对插入数据库中的性能数据及日志消息按照来源、告警级别进行分类,然后通过呈现模块把告警信息实时的通过web进行呈现,重要的告警还通过短信发送功能发送短信到计算机维护人员的通讯工具上;维护人员通过系统发现告警后,对告警的机器进行维护、消除故障,故障消除后,维护人员再通过集中告警系统把告警信息转为历史消息。
图1系统总业务流程图
3系统功能分析设计
通过对系统流程各个环节的功能进行需求分析,本系统的功能可以分为两大部分,一部分是非可视的,如日志信息和性能数据的采集、传送、分析功能,短信发送功能等;另一部分是可视的,如告警信息呈现、告警信息处理、用户权限配置、告警级别配置等。
3.1非可视部分功能设计
非可视部分功能主要包括:
1)syslog日志信息发送、接收、分析功能:应用syslog协议,把主机日志信息通过514端口进行发送,编写程序监听514端口发送来的日志消息,按照协议的消息包格式进行解析。
2)性能数据、数据库日志消息发送、接收、分析功能:采用脚本主动收集的方法采集数据和消息,通过FTP功能进行传送;编写程序扫描FTP目录,对采集的数据和消息进行解析。
短信发送功能:运用短信发送功能,在数据库表中进行匹配关联,对符合条件的告警信息通过短信发送的方式发送到相关人员通信工具里。
4)数据库应用及备份:对采集到的日志消息、性能数据插入到数据库表中、对已处理的信息在数据库表中进行相应的标识;对用户的权限配置、告警级别配置记录保存在数据库表中,对整个数据库进行定时备份。
这些非可视化功能采用的方式有以下优点:
1)实时性强。syslog日志实时存在,监听、采集等脚本程序随系统一起运行。
2)对被监控系统的资源占用小。syslog协议是系统的基本协议,脚本使用的命令是UNIX的基本命令,这些都对系统资源耗费极小。
3)全面性。通过shell脚本和syslog协议采集的日志消息全面准确,不会发生遗漏或人为误操作的发生。
4)安全性高。监控方式不用涉及被监控系统的主机密码,收集过程不用通过外部操作,保证了被监控系统的安全。
3.2可视部分功能设计
可视功能主要是一些信息呈现、数据处理、告警级别配置和人员权限配置的功能,功能相对较简单,但数据量较大。主要包括如下功能:
1)信息呈现功能:根据采集到的日志信息和性能数据,实时的、声光的、集中的呈现出来。
2)信息处理功能:根据维护人员的操作,对已经处理的告警移到历史数据库表。
3)统计功能:按照统计查询的条件对一定时期、特定系统的告警和历史告
警进行统计。
4)告警级别配置:日志信息可按照信息来源、信息的级别来分类。
5)人员权限配置:按照维护人员岗位职责的不同,对不同人员登录账号进行权限的配置。
这些可视功能部分面向的用户是电信企业的员工,不对外网用户开放。考虑到人员分散、实时查看的特性,采用当前比较流行的Brower/Server结构。
4结束语
计算机系统集中监控系统自上线运行以来,在计算机维护上起到了很好的实际效果。系统提高了人员的工作效率,缩短了故障的处理时间,降低了对维护人员的技术要求,给日常的巡检带来了根本性的变革,实现了从分散到集中、从被动到主动的维护模式的转变。给电信企业的良好健康运营打下坚实的基础。
参考文献
[1]Lonvick C.The BSD Syslog Protocol[S].RFC3164,2001.
[2]岳红宇,金以慧,郭宇春.全面了解ODBC技术.微电脑世界.1995,12:35-37.
[3]叶恒舟,牛秦洲.基于HP-UX的批量增删用户的实现.桂林工学院学报.2003,4:382-385.
因篇幅问题不能全部显示,请点此查看更多更全内容