确定 App Engine 或 Cloud Run 应用程序每个实例的最大并发请求数的最佳方法是什么?

问题描述 投票:0回答:1

在 Google Cloud App Engine 和 Google Cloud Run 上,确定每个实例最大并发请求值的最佳方法是什么? App Engine

max_concurrent_requests
的默认值为
10
,Cloud Run 的默认值为
80

理想情况下,您需要尽可能大的值,以最大程度地减少额外实例的启动。

是否有一个工具可以用来查看每个实例的平均请求数并以此为基础?

或者,将最大并发请求设置为

1000
的最大值,然后仅根据 CPU 使用情况来管理扩展是否会更好?在 App Engine 上,这将设置
target_cpu_utilization
值。

google-cloud-platform google-app-engine google-cloud-run
1个回答
0
投票

我个人以我自己的感觉来运营该服务。然后,我观察黄金指标(CPU 使用率、延迟、内存),以确保 1 个实例对于典型流量而言足够强大。

另一个非常重要的指标是冷启动。

  • 如果您的应用程序启动速度非常快,您可以提供创建许多(小型)实例的可能性,最多 1000 个
  • 如果您的实例启动缓慢,并且延迟是一个关键方面,那么最好使用最大 CPU/内存以及与此最大配置相关的一致并发来最大化单个实例上的流量。

从财务角度来看,拥有小型实例更有趣,因为每次添加只会产生少量的额外资源(和成本)。如果你有一个很大的实例,每次扩展增量都会花费很多!

这是对约束的优化,最好的方法是测试和实验。

© www.soinside.com 2019 - 2024. All rights reserved.