无法在 aws CloudWatch 中查看服务部署失败的日志(更新:GPU 资源不足错误)

问题描述 投票:0回答:1

我设置容器(在任务定义中)以使用 CloudWatch 日志:

enter image description here

当我部署服务时(通过任务 > 部署 > 创建服务), 它失败并显示“ECS 部署断路器:任务无法启动。” (与此处相同的错误:资源处理程序返回消息:“操作期间发生错误‘ECS 部署断路器被触发’。” - 根据他们的评论,我需要查看日志,但我似乎在任何地方都看不到它们 - CloudWatch 日志完全为空)

就像上面的海报一样,我还运行一个非常小的 python3 Flask wepabb (基本上是一个“hello world”应用程序),它在我的本地计算机上构建并运行良好。

非常感谢任何帮助

--- 编辑:

好吧,结果是因为容器从未启动,没有创建日志(权限已分配给任务)

在集群 [我的集群] > 服务 > [我的服务] > 事件选项卡下: 我现在反复得到这个:

enter image description here

在集群创建过程中,我使用了 a1.medium(arm64 - 因为我在我的 mac M2(arm64)上本地构建了镜像)...

我也尝试使用 Amazon Linux 2 (arm64) ...没有运气(同样的错误)

此错误专门与 GPU 资源有关...... 在此集群的 EC2 实例上,我似乎看不到有关该实例的 GPU 资源的任何信息(?)

为什么一个简单的 python Flask 应用程序需要 GPU 资源?

amazon-web-services amazon-ecs amazon-cloudwatch
1个回答
0
投票

在集群创建过程中,我使用了 a1.medium(arm64 - 因为我在我的 mac M2(arm64)上本地构建了镜像)...

我也尝试使用 Amazon Linux 2 (arm64) ...没有运气(同样的错误)

您只是在这里尝试不同的CPU。您尚未执行任何操作来选择具有 GPU 的实例。您的 ECS 任务需要 GPU 支持,因此您必须将 EC2 实例添加到实际具有 GPU 的 ECS 集群中。大多数 EC2 实例类型没有 GPU。请参阅EC2 实例类型列表中的加速计算部分。您需要从该列表中选择一个实例类型。由于您也在为 ARM CPU 环境构建映像,因此我建议尝试

G5g
实例类型。

© www.soinside.com 2019 - 2024. All rights reserved.