在尝试使用各种提供程序(裸kubernetes,openshift,aws eks)后,我们发现即使节点有足够的资源(cpu,ram,hdd),在达到~110个pod之后,新的pod挂起处于Pending状态而没有任何事件或错误,除了事件
"Successfully assigned {namespace}/{pod_name} to {node_name}"
我们试图在kubelet,调度程序等中搜索任何相关的日志 - 但除了之前提到的事件之外什么都没有。
有人成功地为每个节点运行了超过110个pod吗?我们做错了什么?
另外值得一提的是,在我们的例子中,它不是110个相同pod的副本,而是来自各种部署/守护进程集的110个不同的pod。当然我们已经调整了节点pod_limit> 110。
kubernetes支持每个节点110个pod。有来自多个通道的请求增加每个节点的pod。
有PR提出支持每个节点500个pod。它仍然是开放的。您可以在以下链接中跟踪状态
虽然当前的扩展目标是500个pods / node(请参阅https://github.com/kubernetes/community/blob/master/sig-scalability/goals.md),但根据您所讨论的总节点数,您可能位于默认调度程序设置不再有用的区域。不幸的是,调度程序调整有点暗示,我建议在sig-scaling Slack通道中寻求帮助。