新書推薦:
《
我的心理医生是只猫
》
售價:HK$
49.5
《
巴拉吉预言
》
售價:HK$
74.8
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:HK$
98.8
《
汉译名著·哲学经典十种
》
售價:HK$
761.2
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:HK$
61.6
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:HK$
76.8
《
自伤自恋的精神分析
》
售價:HK$
52.8
《
大宋悬疑录:貔貅刑
》
售價:HK$
74.8
|
編輯推薦: |
★国内超大规模Zabbix集群负责人力作★全面讲解Zabbix配置应用,深入剖析Zabbix内部原理★用真实工作需求驱动,以实践案例指引,助您监控利器出鞘★适合真正想研究Zabbix的读者阅读
|
內容簡介: |
这是一本由浅入深,全面讲解Zabbix应用与原理的技术书籍,也是作者多年实战经验的总结和浓缩。在概念篇,从一个简单但完整的入门案例讲起,案例中有最基本的概念介绍,通过案例帮助那些只要将服务器加入监控,并且看到监控数据的读者;然后逐步深入,在进阶篇介绍Zabbix的各方各面的配置;在设计篇中对Zabbix的内部原理进行深入剖析,包括Zabbix与数据库的交互Zabbix数据库表的设计等,并分享作者在Zabbix上踩过的坑以及解决问题的思路。最后会在开源部分介绍58同城开源的Zatree和Chrome的插件、手机客户端等工具。这本书会从我们工作中的实际需求出发,以实际案例作为指引,希望对于读者而言,不仅仅是学会某些具体的操作,而是深入了解Zabbix 的设计思路,掌握解决问题的方法。
|
關於作者: |
姚仁捷,1989年出生于上海的码农,资深《冰与火之歌》粉丝,业余跑步爱好者。本书作者作为国内最早接触Zabbix的人之一,从Zabbix 1.8开始使用,在PPTV负责Zabbix社区中大的几个集群之一。精通Zabbix集群运维和使用,深入了解Zabbix源码,善于从代码级别分析解决问题。
|
目錄:
|
第一部分 概念篇
第 1 章 自动化运维和监控系统… ……………………………………………………… 2
1.1 互联网公司的运维工作…………………………………………………………………… 2
1.2 何谓自动化运维…………………………………………………………………………… 3
1.3 监控系统在运维自动化中的角色………………………………………………………… 5
1.4 监控系统的理想化模样…………………………………………………………………… 5
第 2 章 Zabbix简介… …………………………………………………………………… 7
2.1 Zabbix发展现状… ………………………………………………………………………… 7
2.2 选择Zabbix的理由… ……………………………………………………………………… 8
2.3 Zabbix部分名词约定… …………………………………………………………………… 9
第 3 章 Zabbix安装… …………………………………………………………………… 11
3.1 获取Zabbix… ………………………………………………………………………………11
3.2 Zabbix Server安装… ………………………………………………………………………12
3.2.1 Zabbix数据库配置… ……………………………………………………………… 12
3.2.2 安装Zabbix Server… ……………………………………………………………… 13
3.2.3 安装Zabbix Web前端……………………………………………………………… 16
3.3 Zabbix Agent安装……………………………………………………………………………18
3.3.1 UNIXLinux上安装Zabbix Agent………………………………………………… 18
3.3.2 Windows上安装Zabbix Agent… ………………………………………………… 18
3.4 测试Zabbix Agent和Zabbix Server运行… …………………………………………………20
3.5 配置文件详解………………………………………………………………………………20
3.5.1 zabbix_server.conf… ……………………………………………………………… 20
3.5.2 zabbix_agentd.conf… ……………………………………………………………… 24
第 4 章 监控第一台Host… ……………………………………………………………… 26
4.1 Host在监控系统中的活动… ………………………………………………………………26
4.2 添加一个用户………………………………………………………………………………27
4.3 把服务器加入Zabbix监控… ………………………………………………………………27
4.4 添加Item… …………………………………………………………………………………28
4.5 添加Trigger… ………………………………………………………………………………29
4.6 设置Action… ………………………………………………………………………………31
4.7 收到第一封报警邮件………………………………………………………………………33
4.8 Zabbix 报警流程… …………………………………………………………………………33
4.9 看,Zabbix在工作呢… ……………………………………………………………………34
4.9.1 全局搜索框………………………………………………………………………… 35
4.9.2 查看监控数据……………………………………………………………………… 35
4.9.3 查看报警信息……………………………………………………………………… 36
4.10 添加自定义监控点… ……………………………………………………………………37
第二部分 配置篇
第 5 章 增加监控… ……………………………………………………………………… 40
5.1 Host配置… …………………………………………………………………………………41
5.2 Item属性… …………………………………………………………………………………45
5.3 Item类型… …………………………………………………………………………………48
5.3.1 Zabbix Agent类型… ……………………………………………………………… 48
5.3.2 SNMP类型… ……………………………………………………………………… 51
5.3.3 IPMI类型…………………………………………………………………………… 52
5.3.4 日志文件监控……………………………………………………………………… 53
5.3.5 计算型Item… ……………………………………………………………………… 54
5.3.6 Zabbix内部监控… ………………………………………………………………… 55
5.3.7 ssh类型Item………………………………………………………………………… 58
5.3.8 Telnet类型Item… ………………………………………………………………… 60
5.3.9 External Check类型Item…………………………………………………………… 60
5.3.10 Aggregate类型Item……………………………………………………………… 60
5.3.11 Trapper类型Item… ……………………………………………………………… 62
5.3.12 JMX类型Item… ………………………………………………………………… 62
5.3.13 ODBC类型Item…………………………………………………………………… 64
5.4 Item历史数据History和Trends………………………………………………………………66
5.5 使用Application对Item分组…………………………………………………………………67
5.6 Item Key详解… ……………………………………………………………………………68
5.7 Template模板… ……………………………………………………………………………69
5.7.1 新建和配置一个Template… ……………………………………………………… 69
5.7.2 建立取消Host和Template的关联………………………………………………… 71
5.7.3 修改Template… …………………………………………………………………… 73
5.7.4 Template和Host… ………………………………………………………………… 73
5.7.5 Template之间的父子关系… ……………………………………………………… 74
5.8 Clone、Full Clone和Mass Update… ………………………………………………………75
5.9 Windows监控… ……………………………………………………………………………76
5.10 VMware监控… ……………………………………………………………………………82
5.11 Zabbix监控性能……………………………………………………………………………84
第 6 章 报警配置… ……………………………………………………………………… 86
6.1 Triggers………………………………………………………………………………………86
6.1.1 配置Triggers………………………………………………………………………… 86
6.1.2 Trigger expression… ……………………………………………………………… 87
6.1.3 Function详解… …………………………………………………………………… 89
6.1.4 Trigger依赖………………………………………………………………………… 92
6.1.5 Trigger等级………………………………………………………………………… 94
6.1.6 单位………………………………………………………………………………… 95
6.2 Events… ……………………………………………………………………………………95
6.3 Actions… ……………………………………………………………………………………96
6.3.1 Action… …………………………………………………………………………… 97
6.3.2 Operation…………………………………………………………………………… 99
6.3.3 Condition………………………………………………………………………… 104
6.3.4 Escalations………………………………………………………………………… 107
6.3.5 Unsupported状态的Items的报警… …………………………………………… 110
6.4 Media类型… …………………………………………………………………………… 111
6.5 Maintenance状态………………………………………………………………………… 116
第 7 章 数据可视化… ………………………………………………………………… 118
7.1 Graph… ………………………………………………………………………………… 118
7.2 Network Maps… ………………………………………………………………………… 123
7.2.1 新建Maps………………………………………………………………………… 123
7.2.2 创建元素………………………………………………………………………… 124
7.2.3 选择元素………………………………………………………………………… 126
7.2.4 关联元素………………………………………………………………………… 126
7.2.5 关联指示器……………………………………………………………………… 126
7.3 Screens …………………………………………………………………………………… 127
7.4 Slide shows … …………………………………………………………………………… 131
第 8 章 Users和Macros……………………………………………………………… 133
8.1 User和User group………………………………………………………………………… 133
8.1.1 配置User… ……………………………………………………………………… 133
8.1.2 User group… …………………………………………………………………… 135
8
|
內容試閱:
|
前言
本书的由来
我从职业生涯开始至今,就一直在和监控系统打交道。
我最早在eBay 容量规划小组工作,使用监控系统查看服务器状态及网站运营指标;后来
到PPTV 运维部,通过监控系统的数据了解上线发布的结果和网站的健康程度等情况;现在到
了唯品会,我们的监控系统能够从业务、技术两个维度考察当前公司网站的运作情况。
在有监控系统之前,工程师需要到服务器上去敲命令来获取系统数据;为了分析问题,可
能还需要将数据复制到本地计算机的Excel 里进行画图;最要命的是,在出现问题的时候无法
知道,只有在用户报障后才能察觉。这是多么骇人听闻的场景!
而当我们有了一个好的监控系统后,这些问题就迎刃而解了。我们可以在一个界面中浏览
整个机房的服务器状态、可以在Web 前端方便地查看监控数据、可以回溯寻找事故发生时系
统的问题和报警情况。现在,我们的工程师们已经可以一边悠闲地喝着咖啡一边分析问题了。
监控系统是整个运维自动化体系中非常重要的环节。从服务器上架到最后被回收重用,都
有监控系统的身影。服务器上架时,它需要添加监控;在服务器工作过程中,监控系统要时刻
注意服务器的健康,并且在服务器出现异常时,要发出报警通知对应的人员;在服务器被回收
时,监控系统要取消服务器的监控。这些都需要监控系统拥有API,能够方便地跟外部其他系
统一起工作,把自己的工作自动化起来。
国内的互联网巨头们,可以自行开发一套监控系统。而对于绝大多数企业来说,开源的
Zabbix 是非常棒的选择。它能够非常好地实现以上这些需求。可以说,目前Zabbix 是最热门
的开源监控系统。
本书的内容结构
从周围的QQ 群、论坛等地方,我发现大家对于Zabbix 的学习都是非常零散的,缺少一个
系统的学习过程和解决问题的正确思路。在这本书的前面,我会先向大家介绍一个最简单的入
门案例,案例中有最基本的概念介绍,通过案例帮助那些只需将服务器加入监控,并且看到监
控数据的读者。后面深入一些,会介绍Zabbix 的方方面面的配置,适合打算使用Zabbix 高级
功能的读者。在接下来的部分,会深入剖析Zabbix 的内部原理,包括Zabbix 与数据库的交互、
Zabbix 数据库表的设计等我在Zabbix 上踩过的坑以及解决问题的思路。希望能授之以渔。在本
书的最后部分,主要介绍Zabbix 在开源方面的进展,最主要的就是58 同城开源的Zatree,以
及Chrome 的插件和手机客户端。
本书会从我们工作中的实际需求出发,介绍Zabbix 的使用方法和其配置管理。在这些内
容之后,会有深入一些的对于Zabbix 实现的讲解,希望对于读者而言,不仅仅是学会某些具
体的操作,而是深入了解Zabbix 的设计思路,掌握解决问题的方法。
作者联系方式
由于经验的不足,书中可能会有一些不足之处,大家可以通过微博@ 超大杯摩卡星冰乐,
或者邮箱baniu.yao@gmail.com,与我联系。
声明
在刚开始进行写作时,我考虑到很多读者是用中文版的Zabbix,所以文中的Zabbix 的术
语都使用中文。但后来我觉得对于Zabbix 的术语,研究人员是需要了解它的英文说法的,这
样在同行之间才能更好地交流,也可以在Google 上更好地检索信息。基于这个原因,我将之
前的中文术语全部又换成了英文。由于这些术语非常多,虽然编辑帮我细致地进行了检查,难
免有疏漏,希望大家能够谅解。
致谢
在前言的最后,要感谢很多人。首先感谢的是我的父母,没有你们,就没有我。然后要感
谢我的老婆,因为要忙于写书,很多时候不能陪你。最后要感谢的是诸超、陈文春、吴晓刚、
周昕毅、朱宁和刘海阳等同事的帮助,在我写书的过程中,给出了很多宝贵的建议。谢谢各位。
|
|