是否可以根据 GPU 指标自动缩放 Seldon 部署?
官方文档(https://docs.seldon.io/projects/seldon-core/en/latest/examples/autoscaling_example.html)中,自动伸缩的前提是使用metric-server,而metric-server没有自定义指标(仅 CPU/内存)。
我正在 AWS EKS 集群上使用 Nvidia 设备插件。
由于我不是 AWS 架构师,请注意,下面提到的任何解决方案都不是最佳的。
我找到了一个类似的文档,提供了上述步骤的具体步骤,请参考[1][2] 如果您想将 pod GPU 指标暴露给 ws cloudwatch,请参考[3]
参考:
[1] https://www.private-ai.com/2022/05/31/how-to-autoscale-kubernetes-pods-based-on-gpu/
[2] https://github.com/DevSecOpsSamples/eks-gpu-autoscaling
[3] https://aws.amazon.com/blogs/machine-learning/enable-pod-based-gpu-metrics-in-amazon-cloudwatch/