基于Nagios的自动化集群服务监控系统的实现

Slides:



Advertisements
Similar presentations
一、软件简介 二、功能介绍 三、产品优势 四、应用范围 五、成功客户 目录目录 软件简介 ●员工工作时间,都认真工作了? ●还是在玩游戏? ●浏览与工作无关的网站? ●收发私人邮件? ●甚至将公司的机密资料拷贝带 走?或是通过邮件或聊天工具泄 密? …… 解决之道.
Advertisements

西南政法大学图书馆 江波 重庆. 传统图书馆自动化图书馆复合图书馆数字图书馆  图书馆为图书流通服务所制定的相关规则,包 括图书流通类型、读者类型、读者可借阅图书 数量、可借阅时间、可续借时间、可续借次数、 可预约数量等。
《中国知识产权指数报告 2009 》 新闻发布会 1. 中国第一份 IP 指数报告 -- 探索知识产权发展与经济增长关联度 2008 年 2009 年 2.
教務處註冊組 /7 (二) 10 : 00 至 15 : 00 止 ★ 6/8 彙整報名資料後, 6/9 向高中承 辦學校報名 ★ 因校內作業時間緊迫,逾時恕不 受理。 校內報名時間.
一、老师申请题目,以下指导老 师操作。 1. 登录教务系统 web 端. 2. 点击 “ 毕业设计 ” 工具栏下拉菜单中的 “ 论文 _ 教师申请题目 ”
彩虹总在风雨后, 辩证看待当前的产业困境 彩虹总在风雨后, 辩证看待当前的产业困境 电力行业 2008 年中期投资策略 招商证券研究发展中心 彭全刚 二零零八年六月.
我的未来不是梦 攀枝花市经贸旅游学校. 1. 文中案例王萍苦恼的原因是 什么? 2. 你有哪些办法可以帮助王萍? 导入 思考  谁来帮帮她?
三水区安监局 企业安全用电 2013年4月.
當我已老 謹以此文獻給像我一樣流浪在外的子女們.
企业价值收益法评估 ----财务报表调整 主讲人:阮咏华 1.
钱伟长校长和自强不息的精神 —钱伟长学院钱伟长教育思想实践丛书 —2011年10月9日钱伟长学院宣告成立 探寻大师的轨迹--钱伟长为什么能?
2015年12月14日-2015年12月20日 缩略版.
政府採購法規概要 PartⅠ補充 102年採購基礎班 報告人: 梁靜媛.
指導老師:羅夏美 組別:第四組 組員: 車輛二甲 蔡中銘 車輛三甲 莊鵬彥 國企二甲 陳于甄 國企二甲 詹雯晴 資傳二乙 林怡芳
广西师范大学教科院马佳宏 电 话 0773- (O) 高校教师资格认定考试的若干事项 广西师范大学教科院马佳宏 电 话 0773- (O)
数字化校园建设与思考 扬州大学信息中心 沈 洁 2017年3月3日.
数据通信与计算机网络 第1讲 绪论 浙江万里学院 邵鹏飞.
台 灣 頭 痛 學 會 全台有一百五十萬人為偏頭痛所苦,您是其中之一嗎? 簡介 為何會有偏頭痛? 偏頭痛自我檢測 宗旨與任務 頭痛網站
美联软通国际通信业务介绍 北京美联软通科技有限公司 2013年7月.
會計資訊系統 專章A.
第三章 調整與編表.
美联软通短信平台解决方案 北京美联软通科技有限公司 2013年7月.
审计案例研究 第一讲 辅导教师 周桂芝.
龙芯多媒体电脑教室培训 龙梦极域电子教室 江苏龙芯梦兰科技股份有限公司.
IT运维管理解决方案 -轻松管理,自在运维 产品经理 刘曜.
二十世纪外国文学专题 章丘电大 李颜.
职 业 礼 仪 讲师:刘巍女士.
李建民 教授 北京百川健康科学研究院 脊柱健康技术研究中心
峰信 电话管理系统 产品介绍 上海艾家电子商务有限公司 2011年7月.
香港普通話研習社科技創意小學 周順強老師.
“网络问政”给九江新闻网 带来新的发展机遇 -- 九江新闻网 高立东 --.
第八章 网络课程的设计与开发.
三大自然区的内部差异 地理 全日制普通高级中学教科书(选修) 第二册 人民教育出版社地理社会室 编著 人民教育出版社 关于.
中国电信 黔西南州教育信息平台讨论会.
揭秘 庄家 股市中的 为什么你的股票一买就跌,一卖就涨? 为什么出了利好,股价反而下跌? 为什么有的股票一直涨停?
《呼叫中心从优秀到卓越》 ——黄 科.
海信FW3010PF防火墙介绍 北京海信数码科技有限公司
社会工作概论 个案工作 课程培训 深圳电大 赖小乐.
互联网时代班主任的挑战 万玮 2014年9月20日.
前言.
科學科 污染 空氣 成因 的 : 題目 及 減少空氣污染的方法 陳玉玲 (4) 姓名 : 去到目錄.
基于WinSock的邮件系统 1 设计目标: 1.1 SMTP发送邮件服务器(c语言) 1.2 POP3接受邮件服务器(c语言)
授課大綱 第一章 緒 論 第一節 應用文的意義 第二節 應用文的種類 第二章 書 信 第一節 書信的種類 第二節 書信的結構 第三章 便 條
乳猪断奶后拉稀,掉膘与教槽料.
苏州大汇信息科技有限公司 招聘简介.
黃俊榮 邱敏乘 蔡一郎 國家高速網路與計算中心
通过外网访问邮件系统的说明 信息中心.
行云服务:助公有云普及一臂之力.
by 臺中市政府教育局資訊教育暨網路中心 劉育彰
鄉村尋根-農具篇.
TCP/IP Protocol Suite TCP/IP協定 第二組 投影片製作by簡嘉宏 綦凱宏 林睿敏 滕孟哲.
Cloud (AWS) 產品放置 ex.巴士, 球場, 旅館 …. 客戶需求SW模組化 1.客製化需求 2.Web技術
Haiwell Cloud 海为云介绍.
考试题型 填空题(30) 选择题(20) 名词解释(10) 问答题(24) 计算题(16) 附加题(30) 成绩核算:
政府採購作業流程.
投標須知及招標文件製作 行政院公共工程委員會 鍾佩真
K/3 Cloud V6.0产品培训 -- 业务监控 K/3 Cloud 产品部
办公自动化基础 主讲教师:韩伟颖. 办公自动化基础 主讲教师:韩伟颖 第十章 数据的处理与分析 10.1 数据排序 10.2 数据筛选 10.3 分类汇总 10.4 创建与编辑图表.
K/3 Cloud V6.1产品培训 -- 业务监控 K/3 Cloud 产品部
目次检索 打印 下载 文字摘录 更换背景 多窗口阅读.
如何检索统计申请与在研项目(科研人员) “科研之友”技术支持小组
新竹縣108學年度第1次國小以上 特殊教育鑑定安置說明會
進修學院與我.
“修身成材” 班级干部培训班 黑龙江大学党委学工部.
慈惠醫護管理專科學校圖書館 館際合作使用方法.
第10讲 Web服务.
“上海市教师教育课程资源共享管理平台” 学分银行操作指南
講師 劉金龍 經歷:臺中市政府發包科科長 TEL: #11667
第1章 WWW和LAMP基本觀念.
第四章 買賣業會計.
Presentation transcript:

基于Nagios的自动化集群服务监控系统的实现 报告人 胡庆宝 2015.08.20

报告提纲 系统背景 Nagios介绍 基于Nagios的自动化监控 效果展示

报告提纲 系统背景 Nagios介绍 基于Nagios的自动化监控 效果展示

系统背景 计算中心机器上架流程 (1)上架申请 (2)初审 (3)审批 (4)机器上架 (5)网络连接 (6)系统安装 (7)监视部署 (8)设备确认

系统背景 计算中心机器上架流程 (1)上架申请 (2)初审 (3)审批 (4)机器上架 (5)网络连接 (6)系统安装 (7)监视部署 (8)设备确认

报告提纲 系统背景 Nagios介绍 基于Nagios的自动化监控 效果展示

Nagios 介绍 Nagios全名为(Nagios Ain’t Goona Insist on Saintood),最初项目名字是 NetSaint。它是一套比较成熟 的企业级开源监控系统,遵循GPL许可,可查阅全部源代码。 主程序通过调用系统定制或用户自定义的监控插件,实现对各 种资源的监控,如网络设备、主机资源、系统服务、工作站、 操作系统、数据库、应用程序以及特殊系统服务等,提供检测 收集、数据统计分析、可视化Web集中展示和灵活多样的告警 通知等一系列监控解决方案

Nagios主要功能 集中统一监控网页,实现查看与统计 监控网络服务(SMTP、POP3、HTTP、NNTP、PING等) 监控主机资源(处理器负荷、磁盘利用率等) 监控应用服务(网站运行状态、作业运行、存储服务等) 分组定义、并行检查 发现问题及时告警联系人(通过EMail、短信方式) 可配置报警通知设置(7*24小时,5*8小时) CGI功能,它可以在主机或服务的事件发生时获取更多问 题定 自动报警日志回滚 实现对报警事件处理的注释与查看

集群总体监控

集群服务监控

系统架构 基于Nagios框架的逻辑 结构,将大规模数据 中心监控系统按照实 现逻辑的不同,设计 为自下而上的三层总 体结构,分别为监控 实体层、监控抽象层、 监控逻辑层

监控原理 http://www.cnblogs.com/zhuhongbao/p/4174868.html

Nagios特点和优势 可自定义监控 可开发、可配置 权限管理 高可用监控 功能集成 实时报警 应用广泛

报告提纲 系统背景 Nagios介绍 基于Nagios的自动化监控 效果展示

使用Nagios的问题不足 当前的大规模集群监控系统,要实现大量的人工配置工作,即使 前期搭建好系统,在后期的运维过程中也需要管理员花费大量的 精力进行维护,主要问题如下 系统和监控对象的配置管理文本操作不利于后期维护 大规模集群初始化配置的时间长,效率低 监控对象动态变化较多,经常忘记增加或者删除监控造成监控信息与实 际环境不一致 管理员要有LINUX下的管理和维护经验

解决方案 目前市场上针对自动化监控探测的系统,主要是针对网络监控设计, 如cacti等,其原理是通过扫描网络端口和snmp 服务实现监控 在高性能计算集群中,除了基本的网络监控还需要实现对非标准的或 自定义的存储和作业等服务进行监控 本系统通过采用新的技术方案扫描服务器,判断目标主机监控状态, 自动化添加服务监控,缩短系统上架时间,进而能够迅速发现故障和 解决问题,提高集群系统的部署效率和维护效。

实现自动化服务监控技术 2018/12/1

自动扫描探测程序 工具:nmap. 其基本功能有三个,一是探测一组主机是否在线;其次是扫描 主机端 口,嗅探所提供的网络服务;还可以推断主机所用的操作系统 。 协议:TCP Connect 扫描 原理:对定义的网段内的IP进行逐个扫描,通过调用系统socket函数 connect()连接到目标计算机上,完成一次完整的三次握手过程。如果 目标端口5666 or 12489 有程序在监听,那么connect()就能成功返 回。如果端口没有开放则返回RST/ACK复位报文。 应用:nmap -sT -p 5666 -P0 –n 192.168.50.112

应用服务分类模块 对开放有5666或12489端口的客户端,通过对比程序,查看是否 在监控列表中。如果没有在监控范围内,则进行服务器分类监控 类比。将该机器加入对应的监控list里。

数据库设计 将扫描到机器信息通 过应用服务分类、分 组分析等在数据库中 生成相应表项

配置文件自动生成程序(服务定义) 生成配置文件 :通过mysql中定义各对象关系,生成Nagios监控对象的文本配置 检查配置程序:检查各个配置文件的依赖和对应关系 重启服务 :重启服务,配置生效,完成监控流程

API实现-基于网段 Usage: ./mscan -a add/del -p Port -S netseg example: ./mscan -a add –p 5666 -S 192.168.1.0 #对192.168.1网段 扫描添加监控 ./mscan -a del –p 5666 -S 192.168.1.0 #对192.168.1网段 扫描删掉监控 2018/12/1

API实现-基于IP Usage: ./remote_mom -a add/del -n nodename -i ipaddress example: ./remote_mom -a add -n cloud0011 -i 192.168.0.1 #添加 监控 ./remote_mom -a del -n cloud0012 -i 192.168.0.1 #删除 监控 新增加的虚拟主机监控 自动加入到 “虚拟云服务器” 监控服务器 列表中 2018/12/1

报告提纲 系统背景 Nagios介绍 基于Nagios的自动化监控 效果展示

在云计算平台中应用

总体性能 监控平台平均监控 1500多个设备 1万多个服务 平均服务延迟30s

谢谢 技术交流:zhengw@ihep.ac.cn 010-88236852