- prometheus
- 钉钉预警
部署Prometheus 软件
首先,检查一下我们所运行的Helm版本
|
|
当我们使用Helm 3时,我们需要添加一个stable 镜像仓库,因为默认状态下不会设置该仓库。
|
|
Helm配置完成后,我们可以开始安装prometheus-operator
|
|
编辑values.yaml
cat values.yaml
|
|
安装 prometheus-operator
helm install --name prometheus-operator . --namespace=monitoring
让我们清理默认规则,使得我们可以更好地观察我们将要创建的那个规则。以下命令将删除所有规则,但会留下monitoring-demo-prometheus-operator-alertmanager.rules。
|
|
|
|
注意:我们只保留一条规则是为了让demo更容易。但是有一条规则,你绝对不能删除,它位于
monitoring-demo-prometheus-operator-general.rules.yaml
中,被称为看门狗。该告警总是处于触发状态,其目的是确保整个告警流水线正常运转。
创建自己的预警
cat prometheus-operator-tomcat-rules.yaml
|
|
现在我们已经完成了Prometheus告警的设置,让我们配置Alertmanager,使得我们能够通过电子邮件获得告警通知。Alertmanager的配置位于Kubernetes secret对象中。
cat alertmanager.yaml
|
|
|
|
可能遇到的坑
|
|
Kubernetes集群Prometheus Operator钉钉报警配置
创建k8s dingtalk-webhook
cat dingtalk-webhook.yaml
|
|
cat /mnt/data/dingtalk/dingdingalert/templates/config.yml
|
|
cat /mnt/data/dingtalk/dingdingalert/templates/template.tmpl
|
|