根据蔚蓝文档,
虚拟机和集群大小:流摄取性能和容量随着虚拟机和集群大小的增加而扩展。每个核心的并发摄取请求数量限制为 6 个。
我当前的设置如下:
我有一个由 26 个虚拟机组成的队列,用于生成指标。这些虚拟机中的每一个都与 3 个事件中心建立生产者客户端连接,每分钟发送 1 个事件。
接下来,我的 ADX Db 包含 3 个表,对应于每个事件中心。我已在每个事件中心和每个 ADX 表之间创建了数据连接。
我发现数据摄取的延迟比我在当前设置中想要的要高,这就是为什么我正在考虑启用流拥塞。
由于我的 ADX 集群使用基本 SKU (E2a_v4),因此它配置为具有 2 个核心,因此我的并发摄取请求上限为 12 个。
但是,我仍然没有看到流媒体摄取所承诺的 2 秒以下延迟。在深入研究文档后,我想知道问题是否是我达到/超过了并发摄取请求限制。我想了解什么被视为摄取请求,以便更好地调查我的设置。
谢谢
默认情况下,摄取请求是指将数据摄取到集群中的任何尝试,无论来源如何。这些请求根据集群的计算资源进行处理,每个 CPU 核心最多有 6 个并发摄取请求。例如,使用具有 2 个核心的基本 SKU 集群 (E2a_v4),您可以处理最多 12 个并发提取请求。
因此,在您的特定场景中,您有 26 个虚拟机生成指标并以每个虚拟机每分钟 1 个事件的速率将事件发送到 3 个事件中心,并且每个事件中心都有与 ADX 数据库中的一个表的相应数据连接。
仅供参考,摄取负载可能看起来相对较轻,但有一些重要因素需要考虑,例如 - 每个事件中心分区都可以并行发送数据,并且每个分区摄取都算作一个单独的请求。如果您的事件中心有多个分区,则可能会导致并发引入请求数量高于预期。因此,如果摄取并发数超过此阈值,集群的 12 个请求限制可能不够。
要求您首先启用 Azure 数据资源管理器的监视,以首先观察任何异常情况,例如限制或失败的摄取尝试,如果可能,请尝试增加核心数量或升级到更高的 SKU。这将增加您的并发限制并提高整体性能。
请查看这些 MS 文档以更好地理解 -