监控是指查看绩效,监督和监督的流程或系统的行为。
Prometheus Alertmanager 向多个 Slack 通道发送通知
我们有两个不同的团队致力于不同的应用程序。我想通过使用相同的警报表达式将警报通知发送到不同的 Slack 通道。我找到了一些例子,但没有...
我想获取有关 API 的数据。 更具体地说:分配了多少个 vCore 以及这些 vCore 上的负载是多少。例如,如果我将 1 个 vCore 分配给一个 API,但它几乎没有被使用,...
如果在 Google Cloud 中收到相同值超过 1 小时,则会发出警报
我在谷歌云中创建了一个函数,每 10 分钟触发一次并向 postgresql 数据库发送查询。它返回一个值。然后我使用 MQL 查询创建了一个警报策略: 获取
我是grafana新手,并试图获取它的备份。 我发现只需存储 grafana.db 文件即可完成。我尝试在另一个 grafana 实例中使用它,它运行良好并显示......
我正在尝试找出一种不同的监控方法。我想使用 MQL 语言,而不是使用 BUILDER 来获取 GCP 小部件中的指标。 问题是,当我使用 MQL 时,我有奇怪的 v...
如何获取给定时间范围内每个命名空间的CPU最大值? 为了获取我使用的值的向量: sum(namespace_pod_name_container_name:container_cpu_usage_seconds_total:sum_rate{})...
当主机频繁更改时,有没有办法在 Datadog 仪表板上为每个主机添加单独的图表?
我正在尝试制作一个仪表板来监视同时在 5 台远程计算机上运行的进程。我希望仪表板单独显示每台机器的指标 - 基本上,我想...
为什么从 K8S 监控时 GCP 报告同一节点的 CPU 利用率较低?
我正在调试 kubernetes 集群中的 CPU 利用率。 当我打开节点池中特定 kubernetes 节点的页面时,GCP 报告平均为 14%。 但是当我打开同一个节点的详细信息时
我创建了一个执行数据库查询并返回计数的 Google Cloud 函数: 导入psycopg2 def my_function(请求): """在 Cloud SQL 数据库上运行自定义 SQL 查询...
我正在使用Grafana Loki,我需要计算特定时间间隔内特定日志消息的总数。例如,我需要......中的日志消息“some-text”的总数
AlertManager - 根据特定作业名称的路由向不同接收者发送警报
我在Ubuntu服务器上配置了prometheusalertmanager来监控多个azure虚拟机。 目前,所有虚拟机实例警报都会通知到默认电子邮件组。 我需要触发警报 茶...
我有异步发布的 CloudWatch 指标,有时还包含过去的数据点。例如,今天可以发布上周数据点的指标。 PutMetricD...
我正在寻找编写某种能够监视应用程序内部状态的框架。在这个假设的应用程序中,它完成用户任务,假设它的状态移动
我创建了一个在我们的系统中运行的 systemd 服务,我想使用已安装在实例上的 telegraf 代理来监视它。 代理目前正在监控基本...
在minikube/k8s中创建新的pod/重启pod时如何进行数据复制?
我正在努力在 minikube 中设置维多利亚指标集群来监控我的服务器。 在这个集群中,我使用 prometheus 将数据发送到 vminsert,后者进一步将其发送到 vmstorage,我...
我需要编写普罗米修斯警报来找出僵尸进程和登录的总用户数。但我找不到上述两个警报的相关指标。 此外,如果特定矩阵不可用,...
如何在后台服务中使用Prometheus在.NET Core控制台应用程序中进行指标和监控?
我正在.net core应用程序中使用Prometheus进行POC。我在 Prometheus 网站上没有获得足够的信息来开始使用 a)如何在后台服务中使用Prometheus进行指标和监控...
我想监控Docker引擎。我按照“使用 Prometheus 收集 Docker 指标”来配置 Docker 守护进程以获取稍后可以使用 Prometheus 收集和分析的指标。 哦...
所以我试图让 vmalert 从 api 强制执行规则,而不是字面的 yaml 文件。当我将规则格式化为 json 后,它显示 vmalert 格式错误的字符常量“%.2f”。 我是在p之后写的...
如果两个高基数指标永远不会一起变化,普罗米修斯中的基数会爆炸吗?
我有一个带有“端点”标签的 Prometheus 指标 request_duration。服务正在运行,正在被抓取,并向 Prometheus 报告 100 个不同端点的指标,这些端点都是