monitoring 相关问题

监控是指查看绩效,监督和监督的流程或系统的行为。

我如何控制命名空间可以保存的事件数量?

我想控制我的租户可以创建的事件数量。 我的 ttl 是 1 我们的,没关系,但有时我们在几个命名空间中出现峰值,我担心如果发生这种情况,etcd 会被忽视......

回答 1 投票 0

Percona Mongodb Exporter 的自定义端口

如何从同一台 ec2 机器监控多个 mongodb 集群?我想访问多个 mongo db URI 并抓取它们的指标。我正在考虑的一个解决方案是在 diff 处启动 mongodb 导出器...

回答 2 投票 0

Cloud SQL 的 Query Insights 'UTILITY COMMAND' 成本

Postgres 12.8 集群(1 个写入器,1 个读取器)托管在 GCP 上。 每当我“在 READER 实例上”出现 CPU 峰值并深入“查询见解”进行昂贵的查询时,每次最昂贵的操作都是 UTI...

回答 1 投票 0

为什么 Relabelings 无法从服务发现标签中删除某些标签?

我在 EKS 集群中有一个 kube-prometheus-stack 设置,其中有一个 ServiceMonitor,其目标是开箱即用的 kube-state-metrics 的端点。服务发现有这些目标实验室...

回答 1 投票 0

监控仪表板显示 marklogic 中的可用空间

在 MarkLogic 监控仪表板上,可用空间显示为已满。根据 MarkLogic 文档,这是指在考虑了

回答 1 投票 0

使用 Grafana / Prometheus / Tempo 检索 HTTP 请求统计信息

我正在尝试监视部署在多个 Kubernetes 部署上的 java 应用程序。 到目前为止我已经成功发货 使用 Promtail 记录到 Loki 使用运算符向 Prometheus 提供 Kubernetes 指标

回答 1 投票 0

Prometheus Solr 导出器

我正在尝试使用 promethus 导出器监控 solr ./bin/solr-exporter -p 9309 -b http://localhost:8309/solr -f ./conf/solr-exporter-config.xml 在启用基本功能之前它工作正常

回答 1 投票 0

如何根据警报条件成立的持续时间来路由警报

我想设置来自alertmanager的警报通知,以便我收到: 立即松弛通知 如果给定警报触发至少 1 小时,OpsGenie 会发出通知 电子邮件

回答 1 投票 0

如何堆叠分组面板(行)以填满屏幕,并彼此水平重复?

目标: 我正在尝试为所有目标(服务器)创建一个集中仪表板,以监控它们的健康状况并显示在我们办公室的大屏幕上。 我尝试过的: 1-创建了一个变量 Ins...

回答 1 投票 0

Prometheus 抓取间隔导致 Metrics 监控存在时间差异

时间是我们业务的重要组成部分,因此我必须对服务器的时间进行强有力的监控。为此,我在我们的服务器中设置了普罗米修斯节点导出器来获取服务...

回答 1 投票 0

如何填充过去的值以包含偏移量的单元测试 Prometheus 警报?

我正在尝试测试 Prometheus 警报的记录规则。 这按预期工作: # 测试文件.yaml 规则文件: -“../records.yaml” 评估间隔:1m 组评估顺序: - 重新...

回答 1 投票 0

AWS Lambda 监控依赖项

我有一个AWS Lambda python应用程序,我们称其为A。它调用多个服务,我们称其中之一为B。我想知道如何在CloudWatch中监控A和B之间的连接,即:

回答 1 投票 0

错误:无法与 Loki 连接。请检查服务器日志以获取有关 Grafana 的更多详细信息

我已经在我的 Ubuntu 服务器上安装了 Loki,并在另一台服务器上配置了 Promtail 来抓取日志。 Grafana 也在设置 Loki 的服务器上。当我尝试选择洛基时,问题就出现了......

回答 1 投票 0

使用 zabbix 进行 Windows Active Directory 监控

我想使用 Zabbix 监控我的 Windows Active Directory,并希望收集用户、会话、日志等数据。 我怎样才能做到这一点,因为我找不到任何支持文件

回答 1 投票 0

Php 应用程序 - 监控用户的端点使用情况

我有一个基于Php和Fat-Free Framework的php应用程序(还在前端使用mysql,influxDb,vue js)。我希望能够检查哪些端点被使用、由哪些用户使用以及基于...

回答 1 投票 0

将 EMR 上 Pyspark 作业的峰值内存利用率写入文件

我们在 EMR 上运行大量 Pyspark 作业。执行的管道是相同的,但输入可以极大地改变峰值内存利用率,并且该利用率随着时间的推移而增长。我愿意

回答 1 投票 0

错误:telegraf.service 作业失败,因为控制进程退出并显示错误代码

我已经在我的 Ubuntu 实例上安装了 InfluxDB。之后,我安装了 Telegraf。但是当我检查 Telegraf 的状态时,它说:无法启动 Telegraf 请参阅下图以获得更好的

回答 1 投票 0

在电子邮件中报告 AWS ECS 服务集群及其状态

我是 AWS 服务的新手,正在尝试自动化我的 AWS 服务运行状况检查。 作为其中的一部分,我希望创建一个报告,显示 ECS 服务下集群的状态及其任务

回答 1 投票 0

从云函数查询日志分析

我想实时分析GCP日志并从中发出警报。因为分析取决于一些聚合和相关性(例如:事件 A 发生距离事件 B 不到 10 分钟,所以......

回答 1 投票 0

如何将零值(向量(0)与PromQL中的指标值合并

我正在使用 flexlm_exporter 将许可证使用情况导出到 Prometheus,并从 Prometheus 导出到自定义服务(不是 Grafana)。 如您所知,普罗米修斯隐藏了缺失的值。 然而,我需要那些失踪的人...

回答 5 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.