我已经使用 GKE 工作了一段时间了,我创建了标准集群并部署了我的映像和一些依赖项。然而,它运行良好一段时间后突然开始抛出磁盘压力错误。
对此有什么想法吗?此外,我看到图像拉回错误。
首先检查日志记录是否可以看到错误消息(结合类似事件):无法垃圾收集所需数量的图像。尝试释放 9041880678 字节,但只发现 0 字节符合释放条件。如果是这样,那么这条消息来自here,表明Kubelet未能删除未使用的图像。如果满足以下任一条件,则可能会发生这种情况:
该镜像当前不得被节点上运行的现有容器使用
图像最近不得被拉取(以避免抖动)等
只有“符合”删除条件的图像才会真正被垃圾收集并最终被删除。
如本文档中所述,节点条件“DiskPressure”意味着节点的根文件系统或映像文件系统上的可用磁盘空间和索引节点已达到逐出阈值。
您可以按照这里提到的建议进行操作。