Terraform Azure 站点恢复服务管道超时

问题描述 投票:0回答:1

我正在使用一些复制的虚拟机创建一个恢复服务保管库以进行故障转移,但是我正在运行的管道对于 azurerm_site_recovery_replicated_vm 失败。我相信这与应用的超时设置有关,我尝试将读取、创建、删除和更新的超时块添加到 3 小时,但似乎没有任何区别。管道在 35 分钟左右出现故障。

错误:

Error: waiting for site recovery to replicate vm: making Read request on site recovery replicated vm Replication Protected Item (Subscription: "XXX"
│ Resource Group Name: "rg-dr-ukwest"
│ Vault Name: "rsv-dr-ukwest"
│ Replication Fabric Name: "primary-fabric"
│ Replication Protection Container Name: "primary-protection-container"
│ Replication Protected Item Name: "VM1") : authorizing request: clientCredentialsToken: received HTTP status 401 with response: {"error":"invalid_client","error_description":"AADSTS700024: Client assertion is not within its valid time range. Current time: 2024-11-20T10:41:43.2413879Z, assertion valid from 2024-11-20T10:00:53.0000000Z, expiry time of assertion 2024-11-20T10:10:53.0000000Z. Review the documentation at https://learn.microsoft.com/entra/identity-platform/certificate-credentials . Trace ID: dfcd5ea6-29e6-432c-b200-ffe4ab621200 Correlation ID: 389677a3-178d-4904-9f23-0612402706d4 Timestamp: 2024-11-20 10:41:43Z","error_codes":[700024],"timestamp":"2024-11-20 10:41:43Z","trace_id":"dfcd5ea6-29e6-432c-b200-ffe4ab621200","correlation_id":"389677a3-178d-4904-9f23-0612402706d4","error_uri":"https://login.microsoftonline.com/error?code=700024"}
│ 
│   with module.rsv.azurerm_site_recovery_replicated_vm.windowsvm-replication,
│   on modules/rsv/rsv.tf line 234, in resource "azurerm_site_recovery_replicated_vm" "windowsvm-replication":
│  234: resource "azurerm_site_recovery_replicated_vm" "windowsvm-replication" {

只是想知道是否有任何方法可以解决超时问题以阻止管道失败?

azure terraform
1个回答
0
投票

将 Azure Site Recovery (ASR) 与 Terraform 结合使用来自动化灾难恢复计划时,可能会因多种原因而发生管道超时。使用 Azure Site Recovery 执行 Terraform 期间管道超时的常见原因和解决方案包括:

  1. Azure资源操作超时 问题:某些 Azure 操作(例如复制或故障转移)可能需要比预期更长的时间,尤其是在工作负载较大或数据量较大的情况下。 解决方案:增加 Terraform 配置中资源创建或更新的超时。您可以调整 Terraform 配置中特定资源的超时块。 设置自定义超时的示例:

您可以调整创建和更新超时以允许更长时间的操作。您可能需要根据您的环境规模延长 60m 时间值。

  1. 网络问题和连接速度慢 问题:Azure 环境与 Site Recovery 服务之间的缓慢或间歇性网络连接可能会导致超时。 解决方案:确保您的网络基础设施稳定并且有足够的带宽来处理复制和故障转移任务。检查 Azure 网络性能并确保您的网络配置没有问题,例如路由或防火墙规则阻止相关服务之间的流量。
  2. 资源规模大或配置复杂 问题:如果您要复制的资源很大或者资源之间存在复杂的依赖关系,则复制过程可能需要很长时间,尤其是在初始播种的情况下。 解决方案:将您的基础架构分解为更小的组件并分阶段复制它们。另外,请考虑查看 Azure Site Recovery 文档,了解优化大型环境复制的最佳实践。
  3. 资源锁定或冲突 问题:如果同一资源上发生其他操作(例如故障转移、手动配置),可能会导致冲突或资源锁定,从而导致 Terraform 超时。 解决方案:确保在执行 Terraform 时不对 Site Recovery 资源进行手动更改。另外,请验证 Azure 门户中是否没有应用资源锁。
  4. Terraform 状态或执行计划问题 问题:不准确的 Terraform 状态或执行计划可能会导致操作花费更长时间或失败。 解决方案:运行以下 Terraform 命令以确保状态是最新的并且您正在使用最新的计划: 巴什 复制代码 地形刷新 地形计划 地形适用
© www.soinside.com 2019 - 2024. All rights reserved.