写点什么

Grafana 通过改善事件管理助力工程师快速解决问题

作者:Matt Saunders

  • 2024-06-24
    北京
  • 本文字数:833 字

    阅读完需:约 3 分钟

大小:407.68K时长:02:19
Grafana通过改善事件管理助力工程师快速解决问题

Grafana Labs是领先的可观测性解决方案提供商,它宣布对其事件响应和管理(Incident Response and Management,IRM)平台进行了重大改进。这些变更通过简化事件管理流程和减少响应时间,帮助团队更有效地管理和响应事件。

 

Sift InvestigationsGrafana Incident的关键新特性之一。这个工具可以帮助工程师将时间聚焦在解决问题上,消除处理事件过程的辛劳。Sift 能够帮助团队快速过滤数据,实时确定问题的优先级。通过快速隔离错误模式或 Kubernetes 容器的故障,Sift 能够让团队迅速启动修复相关的工作,从而最大限度地减少恢复服务的时间。Grafana 的机器学习为 Sift 提供了支撑。



除了 Sift Investigations 之外,Grafana Labs 还将 Grafana Incident 和Grafana OnCall集成在了一起啊,以便于事件的协作。这种集成能够确保根据可用性和首选的联系方式自动通知相关的团队成员。Grafana Labs 的目标是通过迅速将合适的人员引入到事件处理中,从而加快关键问题的解决过程。

 

进一步的改善包括使用 OpenAI 自动生成简明的事件摘要,“Slack Attachment Uploads”允许工程师通过使用 emoji 表情快速发送与调查相关的文件到 Slack 中。此外,事件现在可以直接在 Grafana OnCall 或任意 Grafana 面板中声明。

 

发布公告还提供了目前正在开发的几个事件管理路线图条目的细节。其中包括引入私有事件以安全处理敏感数据,可定制的事件阶段以匹配特定的运维程序,以及将 Grafana OnCall 和 Grafana Incident 集成到 Slack 应用程序中以增强用户体验。

 

其他即将推出的功能包括“流标签(Flow Labels)”,以确保当告警升级为事件时,所有相关的数据均会被保留下来。此外,在事件通过呼叫链(on-call chain)的过程中,提供了自动声明事件的能力,在 Grafana IRM 移动应用程序中扩展事件管理功能的能力也正在研究中。这将使响应者能够直接从他们的移动设备中管理事件。

 

Grafana Labs 鼓励团队探索这些新特性,并将其集成到事件管理策略中。

 

原文链接:

Grafana Frees Up Engineers to Fix Problems with Improved Incident Management

2024-06-24 10:255990

评论

发布
暂无评论
Grafana通过改善事件管理助力工程师快速解决问题_可观测_InfoQ精选文章