Google Kubernetes Engine(以前称为Container Engine)负责配置和维护底层虚拟机群集,扩展您的应用程序以及日志记录,监控和运行状况管理等运营后勤。
GKE 节点升级卡住“错误 400:集群正在运行不兼容的操作”
我有一个 GKE 集群正在尝试升级其节点。但似乎操作被卡住了,我可以看到过去 2 天出现以下错误。 当我尝试使用 CLI 运行任何命令时,它会...
我的集群在 gke 标准模式下运行 这是详细信息 产品环境 GKE 标准集群正在运行 带 2 个节点池 和 9 个节点 默认池 1.28.3-gke.1286000 5(每个区域 1 - 2 个)e2-
GKE 入口错误:“缺少一个或多个资源。如果资源创建时间比预期长,您的配置可能无效。”
我正在使用 helm 在 GKE 集群上部署 GCE 外部入口,但我一直收到此错误缺少一个或多个资源。如果资源创建时间比预期长,您可能会...
使用 JSON 路径查询输出将内存输出从 Ki 转换为 MB
我正在运行以下查询以获取两列的两个输出: 姓名 记忆 但内存输出以 Ki 为单位显示。我想在显示时将节点内存的输出转换为MB...
Istio - 404 NR Route_not_found
我在 GCP 中有一个 Linux 盒子,安装了 docker,Prometheus 作为容器运行。 我还有 2 个安装了 istio 的 GKE 集群(A 和 B)(仅作为入口控制器)- 服务信息...
GKE jenkins kubernetes 插件节点选择器不起作用
我正在使用 Jenkins 通过 kubernetes 插件版本 1.30.3 将我的 Docker 映像部署到 GKE。到目前为止效果很好。但现在我尝试通过添加节点来选择 GKE 中定义的节点池
GKE Autoprovisioning 未在资源限制内为大型实例创建节点池
我有一个启用了自动配置的 GKE 集群,集群的 cpu 限制为 250,内存为 1000GB。但是,创建请求 46 个 vCPU 和 200GB 内存的 pod 会导致错误号。
GKE 无法连接服务器:拨打 tcp server_ip: i/o timeout
每次在 kubernetes 集群中运行命令时,都会收到以下错误消息:无法连接到服务器:拨号 tcp server_ip:i/o timeout 我已经按照步骤一步一步来了...
如何通过 Google Cloud Classic VPN 从外部网络连接到 Kubernetes 工作负载集群 IP?
我们有一个在 GKE 上运行的 Kubernetes 集群,使用为此创建的自己的 VPC,子网为 10.184.0.0/20。该集群的工作负载已分配了外部负载均衡器......
Kubernetes 在测试环境中限制 kube-system 的 CPU 请求。
我有 6 个单核 google 节点,kube-system pod 占用了太多 CPU。 默认 scylla-2 200m (21%) 500m (53%) 1Gi (38...
我正在使用 helm 在我们的 GKE 实例上安装 Reloader,同时执行以下操作: helm install stakater/reloader --generate-name 我收到这样的回复: 错误:安装失败:clusterroles.rbac。
假设,我有一万个具有相同命名模式的存储桶,其余所有其他存储桶都具有不同的名称。如何使用通配符仅安装那些具有相同模式的存储桶? 例如...
Pytorch 无法在使用 nvidia-tesla-t4 gpus 的 GKE Autopilot 集群上检测到 CUDA GPU
如何启用 Pytorch 在 GKE Autopilot 集群上使用 GPU? 我正在使用 nvcr.io/nvidia/pytorch:21.10-py3 (docs) 映像在带有一个 nvidia-tesla-t4 GPU 的 kubernetes pod 中运行容器。 GKE 自动...
我在 gke 中创建了一个集群,然后创建了一些特定于我的应用程序的部署。我的问题是如何删除那里的特定图像,因为即使我已经设置了我的
Crossplane、GCP 和compute.subnetworks.get
所以我尝试将 Crossplane 与provider-family-gcp 一起使用来创建 GKE 集群。 api版本:container.gcp.upbound.io/v1beta1 种类:簇 元数据: 名称:工作负载集群元 规格: 为了提供...
GKE Autopilot 集群:HPA 显示“无法调度的 pod”并且不会扩展集群资源
我有一个处于 Autopilot 模式的 Google Kubernetes Engine (GKE) 集群。但是,当 Horizontal Pod Autoscaler (HPA) 需要扩展时,我收到一条消息,指示“无法调度 pod”并且...
是否可以通过 kubectl cp for Google Cloud 了解文件传输进度?
如何检测哪个超大规模程序正在运行我的 Kubernetes 集群?
我必须配置在 Kubernetes 上运行的应用程序,并且我无权访问任何特定于超大规模的管理基础设施。 我如何确定我的集群是否运行在其中一个...
如何在下班后将 GKE 集群节点减少到零并在下班后重新启动它们以节省云费用?
我希望我的 GKE 集群节点在非工作时间减少到零,并在工作时间再次增加,以节省云成本。我已经设置了一个云函数来处理这个问题,它适用于
rpc 错误:代码 = 不可用 desc = 上游连接错误或在标头之前断开/重置。重置原因:连接失败
我正在使用 GKE v1.14.10-gke.27+ 和 Istio (v1.2.10-gke.3) 插件。我有 2 个带有 gRPC 的 golang 应用程序(客户端和服务器)。 当我将 mTLS 与...一起使用时,我在客户端应用程序上收到以下错误: