我有一个AWS Elastic Beanstalk设置,其中包含一些.ebextensions
文件,其中包含一些container_commands
。其中一个命令是脚本。脚本完成,但下一个命令不运行。
$ pstree -p | grep cfn-
|-cfn-hup(2833)-+-command-process(10161)---command-process(10162)-+-cfn-init(10317)---bash(10428)
$ ps 10317
PID TTY STAT TIME COMMAND
10317 ? S 0:00 /usr/bin/python2.7 /opt/aws/bin/cfn-init -s arn:aws:cloudformation:us-east-1:278460835609:stack/awseb-e-4qwsypzv7u-stack/f8ab55f0-393c-11e9-8907-0ae8cc519968 -r AWSEBAutoScalingGroup --region us-east-1 --configsets Infra-EmbeddedPostBuild
$ ps 10428
PID TTY STAT TIME COMMAND
10428 ? Z 0:00 [bash] <defunct>
正如你所看到的,我的脚本是一个迷失的僵尸,但cfn-init
没有为它做一个wait(2)系统调用。
当我从命令行运行脚本时,它会正确终止。
我必须假设cfn-init
正在获得SIGCHLD
。为什么不等待(2)继续前进?
此外,有没有更好的方法来调查这个?我一直在寻找运行流程并阅读完全无用的/var/log/eb-*
日志。
FWIW,脚本很简单:
#!/usr/bin/env bash
mkfifo ~ec2-user/fifo
nohup ~ec2-user/holdlock.sh &
read < ~ec2-user/fifo
而nohups的事情很简单:
#!/usr/bin/env bash
(echo 'select pg_advisory_lock(43110);';sleep 10m) |
PGPASSWORD=$RDS_PASSWORD psql -h $RDS_HOSTNAME -d $RDS_DB_NAME -U
$ RDS_USERNAME | tee~ec2-user / nhlog> ~ec2-user / fifo
解决方法是将一系列命令移动到单个shell脚本中,并将其作为单个命令调用。这仍然没有解释ebextensions实际上做了什么,但它让我前进。