浪潮信息InManage是一款面向数据中心基础设施的智能管理平台,通过统一接口、协议,能够纳管多达400种不同厂商、不同型号的服务器、存储、网络等机型,设备规模最多可达10万台,为超 大规模数据中心运维提供智能均衡调度、实时精 准告警等管理功能。
浪潮信息InManage通过智能均衡作业调度平台,能够在秒级内处理超 大规模数据中心亿级实时并发运维管理数据,并基于自研的告警管理框架,实现5秒内响应上千条告警风暴,降低告警误报与漏报的风险。InManage不仅创造了金融行业单一数据中心带外管理的*大纪录,还实现了数据中心基础设施全生命周期管理,整体运维效率提升两倍,为超 大规模数据中心的稳定、高速运行奠定了重要基础。
在面对10万+超 大规模设备管理时,如何避免将系统产生的告警风暴强塞给客户,如何进行根因定位并避免误报、漏报,是数据中心统一管理的另一挑战。为此,InManage提出了CDCAlarm告警管理框架,突破了告警集成管理技术,实现了告警的及时性、准 确性和全 面性,同时支持告警分析、聚合及根因分析等功能。该框架能够为客户呈现按优先级排序和分类聚合的告警,直观易懂、方便用户进一步处理。
InManage使用AI技术手段对告警进行分类、分批处理,实现告警按来源、种类的归并聚合策略,在保证告警时序性的同时,提升了告警处理的整体吞吐量。同时使用基于AI的根因定位方法,快速从告警风暴中准确识别出故障根因,并呈现给客户,解决了客户在面对告警风暴时无从入手的局面。
同时,针对超 大规模监控场景下常见的误报漏报等告警不准确、不及时问题,InManage也做了优化。