- prometheus
 - 钉钉预警
 
部署Prometheus 软件
首先,检查一下我们所运行的Helm版本
  | 
  | 
当我们使用Helm 3时,我们需要添加一个stable 镜像仓库,因为默认状态下不会设置该仓库。
  | 
  | 
Helm配置完成后,我们可以开始安装prometheus-operator
  | 
  | 
编辑values.yaml
cat values.yaml
  | 
  | 
安装 prometheus-operator
 helm install --name prometheus-operator .  --namespace=monitoring
让我们清理默认规则,使得我们可以更好地观察我们将要创建的那个规则。以下命令将删除所有规则,但会留下monitoring-demo-prometheus-operator-alertmanager.rules。
  | 
  | 
  | 
  | 
注意:我们只保留一条规则是为了让demo更容易。但是有一条规则,你绝对不能删除,它位于
monitoring-demo-prometheus-operator-general.rules.yaml中,被称为看门狗。该告警总是处于触发状态,其目的是确保整个告警流水线正常运转。
创建自己的预警
cat prometheus-operator-tomcat-rules.yaml
  | 
  | 
现在我们已经完成了Prometheus告警的设置,让我们配置Alertmanager,使得我们能够通过电子邮件获得告警通知。Alertmanager的配置位于Kubernetes secret对象中。
cat alertmanager.yaml
  | 
  | 
  | 
  | 
可能遇到的坑
  | 
  | 
Kubernetes集群Prometheus Operator钉钉报警配置
创建k8s dingtalk-webhook
cat dingtalk-webhook.yaml
  | 
  | 
cat /mnt/data/dingtalk/dingdingalert/templates/config.yml
  | 
  | 
cat /mnt/data/dingtalk/dingdingalert/templates/template.tmpl
  | 
  |