云巢桌面云十大后台监控技术——云巢十大系列.pptxVIP

云巢桌面云十大后台监控技术——云巢十大系列.pptx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云巢桌面云十大后台监控技术——云巢十大系列

CLOUD @ my fingertips云巢动脉十大后台监控技术目录网络拓扑图网络通路图服务器的温度监控故障服务器隔离服务器的主动隔离维护服务器IO监控服务器上所有存储的容量监控服务器性能监控存储系统容量监控存储故障提示网络拓扑图基本功能网络拓扑图以图形化形式,将各个逻辑组件展示出来,使之一目了然扩展功能具有地域识别具有层次化整体运行状况的展示对于设备的状态予以展示核心价值管理员可以清晰查看整体运行状态对于较大规模部署,可以兼顾宏观和微观网络通路图基本功能将网络系统中的各个物理组件(含客户端)的物理网络拓扑图进行展示,对当前网络的整体状况一览无余扩展功能以不同的色线标识网络的状况对延迟、丢包率进行展示核心价值对网络的健康状况有清晰的表达,辅助管理员进行网络的合理调整当因为网络导致用户使用出现异常时,管理员可以迅速发现问题所在,并予以解决基于网络的服务,最棘手的就是网络的实际状况,可以有效降低管理员的担忧服务器的温度监控动力一般性企业未必有专业的机房有机房的企业未必有合适的空调系统服务器工作温度范围较窄,且温度对于服务器的性能影响巨大,可以将服务器的能力直接降低到10%左右好处可以对服务器的使用环境进行友好展示,提高管理员对运行环境的把握对于出现非正常温度时,可以合理进行干预对于温度引发的性能、效率问题,可以合理的进行定位属于透视能力的一个角度故障服务器的隔离动力正常情况下,服务器的网络、存储访问、服务软件都是正常的当上述因素发生个别或多个异常时,服务器就出现不能提供服务的能力作为一个整体,不能因为单个服务器出现问题而影响部分或整体用户的使用服务器故障具有必然性好处及时将问题服务器隔离在系统之外,不再提供服务将隔离的服务器通知给管理员,由管理员来进行干预,查看问题原因故障发生时,不会影响用户的正常工作整个体系依然处于良性工作状态下,不受故障服务器影响服务器的主动隔离维护动力服务器工作能力出现下降、或者出现不稳定征兆时,但依然能够工作时,管理员可能会进行干预服务器可能另有安排,比如抽调服务器做别的工作时,可以通过此措施先隔离,后迁走管理员做定期维护时,可以通过该措施实现隔离保养好处方便管理员进行服务器的管理、调度服务器的管理、调度时,不影响系统的正常运转提高人性化水平服务器IO监控动力原则上,管理员不宜经常今后后台进行额外的操作,这样做是为了提高系统的安全性服务器的IO是一个衡量系统能力的重要指标,比如: cpu等待、每秒操作数、操作平均完成时间、队列长度等,都是反应系统能力的参数服务器通过对自身已发生的IO状况进行实时、历史展示方式,可以对后台的运行情况进行分析好处管理员通过对IO指标的,可以判断服务器的工作状况无需通过后台进行查看有利于系统进行整体判断,辅助管理员进行预警属于透视能力的一个角度服务器上所有存储的容量监控动力总有一些原因,服务器自身系统的存储存在规划不合理、系统设置不合理等因素,造成系统自身的存储问题,导致系统出现莫名其妙的问题系统coredump造成的存储空间不足,同样也会导致系统问题(用云巢的VueOS则没有这个问题)出现这些问题时,不进入后台,往往我从查找原因;即使进入后台,也很容易忽视这方面的问题好处可以对系统自身存储进行实时的监控,也可以通过分析历史变化进行合理预估无需通过后台进行查看有利于系统进行整体判断,辅助管理员进行预警属于透视能力的一个角度服务器性能监控动力服务器工作状况取决于多方面因素,其中,自身的cpu、内存、swap、local disk、context switch都会影响服务器的能力服务器性能缺乏一致的、归纳性的指标体系一般管理员很难从这些指标中进行管理和干预实现方式将上述指标进行撮合处理,形成一个[0,100]的指标值,并分区予以含义指示,如轻量、正常、压力区使用、超负荷在运维平台上将上述指标进行展示,辅助有经验的人进行判断好处对于一般管理员可以进行辅助判断无需通过后台进行查看有利于系统进行整体判断,辅助管理员进行预警属于系统透视的功能之一存储系统容量监控动力存储系统一般被多组服务器所共享,属于共用组件,对系统性能的影响权重比较高存储系统一般在容量超过80%时,碎片化程度会增高,导致系统能力下降存储容量的扩容需要考虑两个因素:当前量和历史变化趋势好处对于一般管理员可以进行辅助判断无需通过后台进行查看有利于系统进行整体判断,辅助管理员进行预警属于系统透视的功能之一存储故障提示动力分布式存储一般不会一上来就是全面瘫痪,与服务器性质不同比如,一个盘的部分扇区故障、某个盘只读、某个盘不稳定等,这些现象都会被捕获到如果没有一个存储故障提示,容易造成缺口越来越大,最终导致大规模问题发生好处通过监控存储上局部的、不定性的IO故障,可以在磁盘、存储系统出现细微问题时,即可进行有效干预通过指示所在盘

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档