我在Google Kubernetes Engine上使用Cloud Run,我可以毫无问题地部署和访问服务。
但是,由于我正在运行GKE并为24/7集群付费,因此将部署扩展为零并且始终对第一个请求进行冷启动是没有意义的。
我发现可以为Knative autoscaler设置minScale
以禁用here,here和here的缩放比例,但我不知道在哪里放它。
在GKE中有很多配置,服务和工作负载用于Isito和Knative-Serving,但我找不到任何匹配的东西。
我需要编辑哪个文件或配置才能将minScale
设置为1
?或者这不可能,因为Cloud Run在内部管理特定模板?
使用kubectl
,您应该能够在Knative服务上设置注释autoscaling.knative.dev/minScale: "1"
。
有关更多信息,请参阅this page