我的任务是研究如何按计划自动重建现有 AWS EKS 集群。我不是在寻求有关就地升级的建议,而是寻求自动集群销毁和重建过程的建议。该企业有一项安全要求,即所有(工作程序/堡垒/pod)AMI 的使用时间不得超过 45 天,并且没有适当的修补流程,只是为了重建以便获取最新的 AMI。
EKS 自动模式目前也不适合我们。
我最初通过 IaC(Terraform/Bitbucket/Jenkins)构建集群,当我需要重建时,使用 jenkins.yaml 手动启动销毁(销毁 = false)或构建(销毁 = 启用)和单独的 R53 存储库在蓝色/绿色簇之间切换。
如前所述,我希望尽可能地自动化此过程,并想知道这是否可能,或者我是否找错了树或只是错过了要点?我很欣赏使用 terraform 时有状态文件,因此觉得这仍然需要通过 terraform 而不是仅在云中自动化来完成,但不知道什么是/不可能的。
我最初的想法是为 AMI 日期 +40(5 天宽限期)的 CloudWatch 日志创建一个触发器,但想看看在走这条路之前是否有任何明显的遗漏。
我会做这样的事情:
如何触发管道: