我在AWS环境中工作,我需要执行以下[编辑]作为每日计划任务[/ EDIT]:
我查看了AWS Glue,但我认为我无法在其中迈出第一步。您会建议使用哪种工作流程或工具组合?
boto3
库将这些库上传到S3COPY
命令将S3中的数据加载到Redshift中(迄今为止最快的方式)您可以编写Lambda function with scheduled events来抓取API。
与配置EC2实例相比,使用Lambda最可能会更便宜,因为您的工作不耗时且数据量较少。
如果您希望仍然使用EC2实例,则可以将Lambda调度事件用于start and stop the EC2 instance(或者,一旦完成作业,EC2实例本身就可以关闭)。