拥有具有 HA 的 Flink 集群 1.19.0,询问 zk“leader/resource_manager/connection_info”,它显示领导者的 IP:既不是 localhost,也不是 127.0.0.1。这是网络可访问的IP值。
手动停止Leader jobmanager,投票后zk分配给Leader Url:
pekko.tcp://[email protected]:44879/user/rpc/resourcemanager.
当然集群中没有一个节点可以连接到这个Leader:
org.apache.pekko.remote.ReliableDeliverySupervisor [] - Association with remote system [pekko.tcp://[email protected]:44879] has failed, address is now gated for [50] ms. Reason: [Association failed with [pekko.tcp://[email protected]:44879]] Caused by: [java.net.ConnectException: Connection refused: /127.0.0.1:44879]
非常非常奇怪的情况
在你的flink配置文件中勾选
taskmanager.bind-host
,直接保留或者设置0.0.0.0
。