我正在观察我的Galera群集与Prometheus。
galera具有一个度量标准,它给出了群集的节点因流量控制而停止的时间百分比。luckily,有一个指标,自上次
FLUSH STATUS
以来,可以在几秒钟内提供正常运行时间。
问题是,两种指标本身都不是超级有用的。
这只会告诉我,花费的时间暂停的百分比正在下降。 aFLUSH STATUS
告诉我同样的事情,因为百分比随正常时间降低。
所以,我必须在常规的情况下查看集群在特定的瞬间的表现,这很烦人。
我想,“完美”,“我会以速率获得一个有用的,反应性的指标。”
rate
韦尔。由于我收到了该消息,所以我一直在尝试Google和GPT摆脱困境,但我似乎无法掌握它,而Claude也没有。显然,我在promql / grafana基本面上撞墙,所以我必须在Stackoverflow的祭坛上祈祷。
可能你是谷物甲虫,请保留我的智慧吗?我没有看到这树上的树木。已经有一个组合度量,无需乘法。
FLUSH STATUS