Google Cloud Run:解释并发性的 CPU 利用率指标

问题描述 投票:0回答:2

在有关并发的 GCR 文档中,建议允许并发连接,除非您预计每个请求都会耗尽 CPU/RAM (https://cloud.google.com/run/docs/about-concurrency#concurrency-1 ).

我在解释“指标”图表时遇到困难(下图)。

问题:

  1. 这是否意味着我的请求使用了大约 20% 的 CPU? 图表是这么说的,但图例将红线列为 95%:17%,这对我来说没有任何意义。

  2. 如果是(即 20% CPU),这是否意味着我可以安全地将并发性增加到 4-5 (20% x 5 = 100%)?

  3. 如果增加 CPU 数量,我是否会看到单个请求的更好性能,或者处理更多请求的能力? (我正在运行一个 CPU 密集型机器学习任务。)如果没有更多细节,也许无法回答这个问题,但请询问是否有通用答案。

  4. 在“修订”选项卡中,您可以选择预览“较慢的冷启动但更有效的 CPU 使用率”,但尚不清楚每个权衡有多大......是否有人对“启动速度比处理速度慢多少?”

谢谢!

enter image description here

google-cloud-platform concurrency google-cloud-run
2个回答
1
投票

回答您的问题:

  1. 是的,图表显示您的请求使用了大约 20% 的 CPU。下面的图例意味着 95% 的时间,您的 CPU 使用率将在 20% 左右。
  2. 是的,您可以将并发数增加到最大
    1000
    。您可以查看此文档中的并发值设置最大并发(服务)。并发的默认值为
    80
  3. 我还没有尝试过这个,因为这取决于请求的负载。在某些情况下,单个请求的负载较轻或较重。
  4. 最小实例数设置为
    1
    将减少冷启动次数,因为它将准备好服务传入请求,因为它将在空闲状态下运行。缺点是,由于服务仍在运行,这会产生费用。 Google 建议购买承诺使用折扣,因为这些费用非常可预测。有关最小实例的完整文档可以通过此链接找到。

0
投票

传说是统计数据。 50% 与中位数相同,95% 和 99% 是百分位数。 这意味着 50% 的测量值低于 0.67% CPU,95% 的测量值低于 17.8%,99% 的测量值低于 17.96%。 您的 CPU 没有被充分使用。

© www.soinside.com 2019 - 2024. All rights reserved.