过去两天以来,我的环境中的所有 RHEL EC2 实例上的 rsyslogd 的 CPU 利用率均为 100%。我停止并启动了 rsyslog 服务,但问题仍然存在。 这是我们第一次在多个服务器中遇到这种行为。 所有服务器都有足够的磁盘空间/内存。 我检查了内核日志(/var/log/kernel)和服务器消息(/var/log/messages),但没有找到任何有用的信息。
以下是所有服务器的操作系统和内核版本。
操作系统:Red Hat Enterprise Linux Server 7.2(麦坡) 内核:Linux 3.10.0-1160.42.2.el7.x86_64
有人可以对此提出建议吗?
问题是由于 rsyslog 的证书过期造成的。在所有客户端的系统消息中观察到大量连接重试错误。在 rsyslog 中更新证书后,CPU 下降了。
我遇到了类似的问题,在我的情况下,原因不是证书,而是一些登录写入问题。首先找到原因很重要。首先查看journalctl日志
默认情况下,它可能会显示太多条目,因此按时间过滤会很有帮助。使用 sudo 或以 root 身份登录,否则系统日志等不会显示。日期格式为 YYYY-MM-DD HH:MM:SS
sudo journalctl --since "2025-01-07 00:00" --until "2025-01-08 09:00"