手机扫描二维码答题
00:00:00
运维成熟度之监控成熟度评估
录音中...
欢迎您参加企业运维成熟度之监控成熟度评估。
评估预计用时 3 分钟。希望您能通过此次评估,获悉所在企业的IT资源监控能力,并找到更契合的解决方案。
如果您已做好准备,请点击「下一页」进行评估。
IT 运维监控,是⼀个被持续关注了多年的话题。⻓期以来,IT 运维⼈员⼀直寄希望于运维监控系统可以“⽐⽤户和领导先发现业务应⽤系统问题”,希望运维监控系统具备“未⼘先知”能⼒,希望运维监控系统在出现问题 时,可以“直达要害”的告诉运维⼈员是什么原因导致了业务应⽤系统出现了问题...
但⾮常遗憾的是,花⼤价钱采购的商业版运维监控系统,并没有做到“⽐⽤户和领导先发现问题”,⽽且⼤型商业版运维监控系统本身的运⾏和维护⼯作量却很⼤,资源消耗也⽐较“感⼈”;各式各样技术和理念领先的 开源运维监控⼯具和⽅案,也没有真正“未⼘先知”的能⼒,排查问题时,还是要去各个运维监控系统中“翻江 倒海”的寻找“蛛丝⻢迹”,⽽且开源系统也不是免费的午餐,在各种“踩坑”和“试错”过程中艰难的前⾏...
运维监控系统,是“救命稻草”还是“鸡肋”?除了运维监控,我们是否还有更好⼿段或⽅案来为业务应⽤系统的稳定可靠运⾏保驾护航?传统的运维监控系统是否能适应⾼速迭代的IT 技术栈?
针对上述问题,我们从“现状”⼊⼿来进⾏逐⼀剖析:
我们⽬前的IT 运维监控做的怎么样?存在哪些缺失和不⾜?是否可以满⾜企业数字化业务对于稳定可靠运⾏的需求(MTTR,SLA 等)?
通常,我们从以下五个⽅⾯对IT 资源监控能⼒(成熟度)进⾏评估:
IT 资源监控数据采集
IT 资源监控数据处理和存储
IT 资源监控指标体系
IT 资源监控告警和事件处理
IT 资源监控事件分析和故障定位
IT 资源监控数据处理和存储
*
1、同一台主机/服务器/虚拟机上是否同时安装了多个监控代理组件(Agent)
A. 是
B. 否
*
2、是否对关键/核心业务指标进行了监控
A. 是
B. 否
*
3、是否使用 SNMP 协议进行监控数据采集
A. 是
B. 否
*
4、使用使用 IPMI 协议进行监控数据采集
A. 是
B. 否
*
5、是否已经部署统一日志采集产品或平台
A. 是
B. 否
IT 资源监控数据处理和存储
*
1、目前在用的监控工具,其监控数据保留周期是多久
A.1~2个周
B.2~4个周
C.1~3个月
D.3~6个月
E.半年以上
*
2、是否使用大数据技术或流式数据处理技术对监控数据进行清洗、聚合和存储
A. 是
B. 否
*
3、目前在用的监控工具,其监控数据每天的增量是多少
A.数G
B.数十GB
C.数百GB
D.数TB
E.数十TB
IT 资源监控指标体系
*
1、是否对监控指标进行统一集中管理(分类定义、含义、血缘关系等)
A. 是
B. 否
*
2、监控指标是否根据 IT 资源进行分层定义(基础设施层、平台层、应用层等)
A. 是
B. 否
*
3、是否根据业务特质或应用类型对监控指标进行分类定义(黄金指标、关键指标等,标准指标等)
A. 是
B. 否
IT 资源监控告警和事件处理
*
1、是否已经实施统一/集中告警处理产品或平台
A. 是
B. 否
*
2、是否实现对重复的告警消息进行去重或压缩处理
A. 是
B. 否
*
3、是否实现对来自多个监控系统(告警源)的告警消息进行合并与收敛
A. 是
B. 否
*
4、告警事件是否可以触发工单(监控提单)或自动化处置动作
A. 是
B. 否
*
5、是否可以结合 CMDB 或相关 IT 资源管理系统实时对告警消息进行丰富处理
A. 是
B. 否
IT 资源监控辅助定位和事件分析
*
1、当某个 IT 基础设施资源产生告警事件时,是否会通知到依赖此资源的应用系统管理员或与此应用系统相关业务负责人
A. 是
B. 否
*
2、是否支持将告警事件叠加到应用系统拓扑或 IT 资源图谱上进行实时展示
A. 是
B. 否
*
3、是否已经实现针对关键业务路径的“全链路追踪”
A. 是
B. 否
*
4、是否支持对任意告警事件发生前、后 N 分钟范围内的全量监控数据进行可视化分析和展示
A. 是
B. 否
*
您希望我们如何称呼您:
*
请输入您的手机号码:
*
请输入您的邮箱:
*
您的公司名称:
评价对象得分
字体大小