我们假设标准数据工程问题:
假设有一个python脚本可以执行API命中和存储,但这并不重要。
理想情况下,我希望有一些活跃的服务,运行此脚本并自行杀死...到目前为止,我考虑过这些可能性(使用AWS服务):
我怎么看:
我的问题是:这类工作目前的最新技术水平是什么?什么服务有用,有什么经验?
#3的变体...使用用户数据脚本启动Linux Amazon EC2实例,并将Shutdown Behavior设置为Terminate。
User Data脚本执行下载并将数据复制到Amazon S3。然后它执行sudo shutdown -h
来关闭实例。 (或者,如果脚本很复杂,用户数据脚本可以从S3存储桶下载程序,然后执行它。)
Linux EC2实例现在每秒收费,因此将其视为具有更多磁盘空间且没有5分钟限制的更大版本的Lambda。
无需使用CloudFormation来启动实例,因为您只需要删除CloudFormation堆栈。相反,只需使用必要的参数直接启动实例。您甚至可以使用参数创建启动模板,然后使用启动模板简单地启动实例。
您甚至可以为流程添加一些智能并使用现货定价启动实例(将出价设置为正常的按需定价,因为最坏的情况下您只需支付正常价格)。如果由于备用容量不足而无法启动竞价型实例,请改为启动按需实例。