领导者选举 - Pod没有选择领导者

问题描述 投票:1回答:1

我使用kubernetes / client-go领导选举实施了领导者选举。我有2个复制品。这两个pod都是第一次选择作为领导者,但是在此之后同一个pod不被选为领导者。领导人选举在一段时间后停止了。我尝试删除一个pod,然后选择创建的新pod作为leader。一旦pod停止领先,没有pod作为领导者。我使用configmap进行资源锁定。请帮我解决这个问题。

func NewElectorWithCallbacks(namespace, configMapName, identity string, ttl time.Duration, client cli.CoreV1Interface, callbacks *leaderelection.LeaderCallbacks) (*leaderelection.LeaderElector, error) {
hostname, err := os.Hostname()
if err != nil {
  return nil, err
}
broadcaster := record.NewBroadcaster()
broadcaster.StartLogging(log.Printf)
broadcaster.StartRecordingToSink(&cli.EventSinkImpl{Interface: client.Events(namespace)})
recorder := broadcaster.NewRecorder(scheme.Scheme, api.EventSource{Component: identity, Host: hostname})
cmLock := &resourcelock.ConfigMapLock{
  Client: client,
  ConfigMapMeta: meta.ObjectMeta{
    Namespace: namespace,
    Name:      configMapName,
  },
  LockConfig: resourcelock.ResourceLockConfig{
    Identity:      identity,
    EventRecorder: recorder,
  },
}
if callbacks == nil {
  callbacks = NewDefaultCallbacks()
}
config := leaderelection.LeaderElectionConfig{
  Lock:          cmLock,
  LeaseDuration: ttl,
  RenewDeadline: ttl / 2,
  RetryPeriod:   ttl / 4,
  Callbacks:     *callbacks,
}
return leaderelection.NewLeaderElector(config)
}

config, err = rest.InClusterConfig()
v1Client, err := v1.NewForConfig(config)
callbacks := &leaderelection.LeaderCallbacks{
        OnStartedLeading: func(context.Context) {
            // do the work
           fmt.Println("selected as leader")
            // Wait forever
            select {}
        },
        OnStoppedLeading: func() {
            fmt.Println("Pod stopped leading")

        },
    }
elector, err := election.NewElectorWithCallbacks(namespace, electionName, hostname, ttl, v1Client, callbacks)
elector.Run(context.TODO())

enter image description here

go kubernetes leader-election
1个回答
0
投票

您可以将pod部署为statefullsetsheadless service。请参考docs

为什么?

  • Pod将按顺序创建。您定义正在启动的第一个pod是Master,其余是奴隶。
  • StatefulSet中的Pod具有唯一的序数索引和稳定的网络标识。例如下面,
    kubectl get pods -l app=nginx
    NAME      READY     STATUS    RESTARTS   AGE
    web-0     1/1       Running   0          1m
    web-1     1/1       Running   0          1m

即使pod web-0重新启动,pod的名称或FQDN也不会改变。

web-0.nginx.default.svc.cluster.local

<pod_name>.<service_name>.<namespace>.svc.cluster.local

我只强调几点,请完整阅读文档。

© www.soinside.com 2019 - 2024. All rights reserved.