<ha-policy>
<shared-store>
<primary>
<failover-on-shutdown>true</failover-on-shutdown>
</primary>
</shared-store>
</ha-policy>
中学pod
<ha-policy>
<shared-store>
<backup>
<allow-failback>false</allow-failback>
<failover-on-shutdown>true</failover-on-shutdown>
</backup>
</shared-store>
</ha-policy>
观察的问题:
ERROR [org.apache.activemq.artemis.core.server] AMQ222010: Critical IO Error, shutting down the server. file=Lost NodeManager lock, message=NULL
java.io.IOException: lost lock
我尝试了什么变化:
未经HA策略的测试运行,但处于群集模式:
确定定义HA策略,我只是使用相同的PVC(持久卷声明)启动了两个聚集的Artemis节点。行为观察到:
另一个豆荚变得活跃,而另一个豆荚变得被动。即使没有明确定义HA策略,也类似于主动的设置。
shared-store
ha-policy
时,您会看到“ Lost NodeManager锁”,因为该配置会导致经纪人在经纪人运行时主动监视共享文件锁。
shared-store
ha-policy
shared-store
ha-policy
我建议您检查共享存储设备的配置和功能,以确保它能够支持独家共享文件锁。我还建议您监视共享存储设备,以确保没有间歇性问题会导致主要经纪人失去锁。
您可以添加
TRACE
logging for Logging
org.apache.activemq.artemis.core.server.impl.FileLockNodeManager
来帮助您确定为什么主要经纪人丢失其共享文件锁。