';
高效运维 | 全方位资源监控,有效应对一场由虚拟存储引发的事件
排查:虚拟存储用到上限
首先排查运行业务系统的虚拟机CPU是否够用,发现CPU资源使用率不高;然后排查内存,内存资源使用也不高;查看系统磁盘使用情况也正常;再查看业务进程情况,也基本正常,管理员有点懵了。
马上又开始查找运行虚机的宿主机资源情况,发现各项计算资源也是正常,直到排查虚机相关的数据存储时,发现业务虚机存放数据的存储空间已经用到了99%,这也许就是业务系统变慢的原因。
于是该管理员做了业务虚机的迁移,更换了相关数据存储,业务虚机终于运行正常。
复盘:寻求有效运维工具
一共用了30分钟的时间解决了问题,但是这个问题的后续工作没有结束,管理员开始和各个业务部门、业务开发组等沟通迁移和这个数据存储有关的业务虚机,这可不是一时半会可以解决的事情了。
原来最近一段时间,由于业务上线比较多导致虚机数量快速增长,存储空间出现了紧张的情况,但是该单位并没有有效的虚拟化运维监控产品对存储空间的增长情况进行全面的监控。
此次事件虽然解决问题的时间30分钟不算长,但是对于时效性、连续性、关联性很强的金融单位来说,这已经算大的事故了,其亟待寻求高效的虚拟化运维管理之道。
选择:富通云腾ITGo虚拟化运维管理平台
结合自身业务与运维需求,以及对相关平台对比分析后,该金融单位选择安装部署了富通云腾虚拟化运维管理平台,以提高运维服务的质量和效率。
富通云腾ITGo虚拟化运维管理平台可以详尽监控虚拟化主机、虚机、虚拟网络和虚拟存储,也可以对虚拟机的操作系统进行详细的监控,并提供丰富的报表功能使用户全面了解虚拟化环境运行情况。
针对这家金融单位的虚拟化运维管理需求, ITGo平台不仅能够详细监控数据存储的空间使用情况,如下图(非真实客户环境截图):
还可以针对每块数据存储的使用情况进行详尽的监控,如下图(非真实客户环境截图):
同时,根据该金融单位虚拟化管理员的要求,ITGo平台每天早上8点定时给他发送所有数据存储的空间使用情况的报表,方便其每天对数据存储的使用情况进行预估,如下图(非真实客户环境截图):
结语
基于企业虚拟化环境的运维需求,富通云腾研发的ITGo虚拟化运维管理平台采用大数据分析和智能化运维(AIOps)等技术,对虚拟化的各种运维数据进行有效的监控、管理和分析,保证云计算/虚拟化技术的数据中心的高效稳定运行,优化系统资源使用,节省IT设备投资,平台已在300+企业虚拟化环境中部署使用。
疫情期间,富通云腾向企业级客户免费提供为期90日的“ITGo虚拟化运维管理平台”使用权限。