
在噪音中找出信号
几乎所有 IT 运维专业人员对“事件风暴”都不陌生,“事件风暴”是指当某个问题从关联系统中触发数百(有时甚至是数千)条冗余警报时难以确定问题的根源。人工智能事件关联为噪音赋予了意义,将冗余通知分组,并隔离可能引发问题的潜在根源。当出现问题(例如中断)时,不必再花费数小时调查一长串冗余警报。相反,只需转到工具的“概述 (Overview)”页面,其中将展示需要注意的业务服务现状概览和调用场景(相关事件组)。
几乎所有 IT 运维专业人员对“事件风暴”都不陌生,“事件风暴”是指当某个问题从关联系统中触发数百(有时甚至是数千)条冗余警报时难以确定问题的根源。人工智能事件关联为噪音赋予了意义,将冗余通知分组,并隔离可能引发问题的潜在根源。当出现问题(例如中断)时,不必再花费数小时调查一长串冗余警报。相反,只需转到工具的“概述 (Overview)”页面,其中将展示需要注意的业务服务现状概览和调用场景(相关事件组)。
单击“情况 (Situations)”选项卡,查看更详细的现状视图,包括严重程度、时间表和每个分组的独立事件数量。工具按两种方式对事件进行分组:使用机器学习 (ML);引用事件策略,您可配置策略控制分组逻辑。此视图中的类型 "Type" 图标指示事件分组由 ML 完成的还是引用事件策略完成。
您可深入了解每一种情况,查看相关指标、日志和更改。
另外,工具还可确定哪一项事件最有可能是引发根本问题的潜在根源。根据计算事件影响确定,选择影响最严重的事件作为引发更大问题的潜在根源。您可直接从工具中触发Automated Remediation 脚本,也可以设置策略以便在满足特定条件时自动触发Automated Remediation 脚本,从而快速采取行动解决问题根源。
系统对相关事件进行智能分组,节省开关冗余请求单的时间。
不必招募多名 IT 专业人员手动确定问题根源,而是自动开展调查,从而节省时间、精力和资金。
当与Proactive Outage Alerting 和Automated Remediation 结合使用时,系统可以通报问题,确定最可能的问题根源,触发解决问题的行动方案。
此功能开箱即用,无需任何特殊配置或培训。
以下列举了少量集成示例: