在 Rancher 1.x 时期,告警功能是很多 Rancher 用户一直希望能够集成进产品内的,因此在 Rancher 2.0 研发阶段,这一直是 Rancher 研发团队功能列表中的重要一项。
Rancher 2.0发布, 新版本产品中引入了很多酷炫新功能,其中就包括集群和工作负载的告警功能 。
通知程序
Rancher 2.0 的告警功能让用户可以创建自定义警报,并将这些警报发送到多类多个后端系统上。
第一步,是创建通知程序。通知程序是在集群级别创建的。选择【工具/Tools】下拉菜单,在下拉菜单中选择【通知程序/Notifiers】,然后单击【添加通知程序/Add Notifier】,这将打开一个模式窗口,您可以从以下选项中进行选择。
您选择其中一个选项后,接着就需要填写与此选项相关的各种配置参数。比如在下图的 Slack 示例中,您可以看到有一个链接显示了如何配置通知程序。
添加完有效信息后,你就可以试着发送一个测试给通知程序了。Slack 通知的示例如下:
还有其他各类系统的通知接收工作,都可以通过 webhook 来完成。Webhook 可以将通知发送到各种系统,这些系统具有自己的工作流,来处理已触发的特定警报。
集群级别的告警
返回到【工具/Tools】下拉菜单中,你能看到那里有一个【告警/Alerts】的选项。Rancher 里设定了一些预先配置好的告警,不过在这些告警与通知程序关联好之前,它们是不会被触发的。
将告警与通知程序相关联非常简单,只需要编辑告警、设置通知程序、保存,就可以了。
要创建新的告警,只需单击【添加告警/Add Alert】,然后你就会看到下图的界面:
如你所见,您可以设置各种告警相关的选项,这些选项将会与系统或用户资源关联起来。在集群级别,您可以根据集群范围的资源(例如 Node 或实际的 Kubernetes 组件)设置告警。
工作负载级别的告警
工作负载级别的告警需要在【项目/Project】中设置。在【资源/Resources】的下拉列表中,有一个【告警/Alerts】菜单项,在此处单击【添加/add】,你将看到如下界面:
在项目(Project)告警中,您可以设置与实际应用程序工作负载相关的告警。例如,您可以设置如果您的服务未按您设置的规模运行,或者在指定的时间段内重新启动了一定次数,则收到告警通知。
结论
本文旨在简要介绍我们在 Rancher 2.0 中引入的新功能——告警。Rancher 2.0 还在持续升级迭代之中,Rancher Labs 研发团队将进一步更新与增强这些功能,为用户提供更优质更强大的体验。
您还可以在此链接中观看“Rancher 2.0 实战训练营”在线培训中监控告警的这一期内容。未来我们会提供更多 Rancher 2.0 实操系列文档,敬请保持关注~
英文原文:https://rancher.com/blog/2018/cluster-workload-alerts/
评论