我们在晚上安排的cronjob正确启动,但图像本身的运行时间远远超过计划。我们希望拉出映像或从群集请求资源时出现问题。通常我可以在kubectl describe job-name
输出的事件部分看到这样的错误。在本节中,我可以看到诸如pull image
create container
等事件。但是在作业完成后,不再显示任何事件。
是否有可能看到这些事件完成工作?
还是有另一种方法来调查这样的问题?
存储事件的问题比cronjobs更宽泛。默认情况下,Kubernetes中的事件仅存储1小时(kube-apiserver的--event-ttl标志)。这意味着,如果您的cronjob在两小时前运行 - 您将不会在“kubectl describe”中看到事件。
为了保存事件以供以后调查,您需要将它们导出到某处。例如,Google Kubernetes Engine将事件存储到Stackdriver中。对于香草Kubernetes,您可以使用event_exporter或Elasticsearch在Prometheus中存储活动。这是否回答你的问题?