Anthos 服务网格指标

问题描述 投票:0回答:2

我最近部署了 Anthos Service Mesh,开始使用统包方法来部署 GKE 和 Istio。 到目前为止一切顺利,但我看到的一个问题是 Pod 的基本指标(CPU、内存和磁盘)没有显示。

当我查看 prometheus-to-sd pod 的日志时,我看到以下错误:

Error while sending request to Stackdriver googleapi: Error 403: Permission monitoring.timeSeries.create denied (or the resource may not exist)., forbidden

与 fluidd-gke pod 类似的错误。

Unable to export to Monitoring service because: GaxError RPC failed, caused by 7:Permission monitoring.timeSeries.create denied (or the resource may not exist).

我尝试使用 GCP SA 到 KSA 映射来调整工作负载身份权限,但没有成功。 还有人遇到这个吗?

这些是我一直遵循的说明。

https://cloud.google.com/service-mesh/docs/gke-anthos-cli-new-cluster

google-kubernetes-engine google-anthos google-anthos-service-mesh
2个回答
4
投票

事实证明,Workload Identity 不适用于主机网络设置为 true 的 pod。 人们可能会认为,使用 Anthos,可以开箱即用地启用对 Pod 和计算节点的基本监控。

解决此问题的两个选项:

1.) Update the default compute engine account with the following roles:
-roles/logging.logWriter
-roles/monitoring.metricWriter
-roles/monitoring.viewer

2.) Deploy the node pools with a custom service account with the aforementioned roles.

为了让事情顺利进行,我使用了选项#1。


0
投票

在节点池上禁用“GKE 元数据服务器”帮助我们摆脱了这些。您的里程可能会有所不同

© www.soinside.com 2019 - 2024. All rights reserved.