我是 AWS SageMaker 的新手,我的问题可能看起来很愚蠢。我创建了一个需要 GPU 的深度学习模型,并将该模型部署在 EC2 实例上 (g4dn.4xlarge
)具有 Auto Scaling 和负载均衡器。该应用程序运行良好,但我有一些问题:
- 在具有 Auto Scaling 和负载均衡器的 EC2 上部署深度学习模型是最佳实践,还是应该部署在 AWS SageMaker 上(考虑成本)?
- 如何在 SageMaker 上简单地部署模型并创建端点?我的模型已经构建、训练和测试,我只想将其部署在 AWS SageMaker 上。
我们将非常感谢您的指导..