在写入节点上创建“Kind”集群失败

问题描述 投票:0回答:3

我正在尝试为我的 kubernetes 集群设置一个

kind
集群。不幸的是,在写入节点时准备好节点后失败了。我将附上输出和一些信息。预先感谢您的帮助!

干杯

错误

$ kind create cluster --config kind-config.yaml 

Creating cluster "kind" ...
 ✓ Ensuring node image (kindest/node:v1.20.2) 🖼 
 ✓ Preparing nodes 📦 📦 📦 📦  
 ✗ Writing configuration 📜 
ERROR: failed to create cluster: failed to generate kubeadm config content: failed to get kubernetes version from node: failed to get file: command "docker exec --privileged kind-worker3 cat /kind/version" failed with error: exit status 1
Command Output: Error response from daemon: Container c41566958be2239a9470ef2ea636c4b21958ee7620086f526954a02e4a605106 is not running

类配置yaml

apiVersion: kind.x-k8s.io/v1alpha4
kind: Cluster
nodes:
  - role: control-plane
  - role: worker
  - role: worker
  - role: worker

我的节点

$ kubectl get nodes -o wide

NAME      STATUS   ROLES                  AGE     VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE       KERNEL-VERSION     CONTAINER-RUNTIME
gemini    Ready    control-plane,master   3d18h   v1.20.2   192.168.2.203   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
phoenix   Ready    <none>                 3d17h   v1.20.2   192.168.2.129   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
taurus    Ready    <none>                 3d17h   v1.20.2   192.168.2.201   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
virgo     Ready    <none>                 3d17h   v1.20.2   192.168.2.202   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13

我的集群上正在运行什么

$ kubectl get all --all-namespaces

NAMESPACE              NAME                                             READY   STATUS    RESTARTS   AGE
default                pod/nginx-6799fc88d8-62cjd                       1/1     Running   1          18h
kube-system            pod/calico-kube-controllers-86bddfcff-ccrhg      1/1     Running   7          3d18h
kube-system            pod/calico-node-jddnl                            1/1     Running   4          3d17h
kube-system            pod/calico-node-nxwlw                            0/1     Running   7          3d18h
kube-system            pod/calico-node-stnzs                            0/1     Running   0          52s
kube-system            pod/calico-node-zrxzl                            1/1     Running   4          3d17h
kube-system            pod/coredns-74ff55c5b-kb2nm                      1/1     Running   7          3d18h
kube-system            pod/coredns-74ff55c5b-wsgs5                      1/1     Running   7          3d18h
kube-system            pod/etcd-gemini                                  1/1     Running   8          3d18h
kube-system            pod/kube-apiserver-gemini                        1/1     Running   8          3d18h
kube-system            pod/kube-controller-manager-gemini               1/1     Running   11         3d18h
kube-system            pod/kube-proxy-7fcjz                             1/1     Running   8          3d18h
kube-system            pod/kube-proxy-84rr7                             1/1     Running   4          3d17h
kube-system            pod/kube-proxy-lc88w                             1/1     Running   4          3d17h
kube-system            pod/kube-proxy-v4qd9                             1/1     Running   4          3d17h
kube-system            pod/kube-scheduler-gemini                        1/1     Running   9          3d18h
kubernetes-dashboard   pod/dashboard-metrics-scraper-79c5968bdc-mlb4s   1/1     Running   7          3d18h
kubernetes-dashboard   pod/kubernetes-dashboard-7448ffc97b-nq5c9        1/1     Running   7          3d18h

NAMESPACE              NAME                                TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                  AGE
default                service/kubernetes                  ClusterIP   10.96.0.1        <none>        443/TCP                  41h
kube-system            service/calico-etcd                 ClusterIP   10.96.232.136    <none>        6666/TCP                 3d18h
kube-system            service/calico-typha                ClusterIP   10.109.108.233   <none>        5473/TCP                 3d18h
kube-system            service/kube-dns                    ClusterIP   10.96.0.10       <none>        53/UDP,53/TCP,9153/TCP   3d18h
kubernetes-dashboard   service/dashboard-metrics-scraper   ClusterIP   10.110.70.52     <none>        8000/TCP                 3d18h
kubernetes-dashboard   service/kubernetes-dashboard        NodePort    10.106.194.127   <none>        443:31741/TCP            3d18h

NAMESPACE     NAME                         DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR            AGE
kube-system   daemonset.apps/calico-node   4         4         2       4            2           kubernetes.io/os=linux   3d18h
kube-system   daemonset.apps/kube-proxy    4         4         4       4            4           kubernetes.io/os=linux   3d18h

NAMESPACE              NAME                                        READY   UP-TO-DATE   AVAILABLE   AGE
default                deployment.apps/nginx                       1/1     1            1           18h
kube-system            deployment.apps/calico-kube-controllers     1/1     1            1           3d18h
kube-system            deployment.apps/coredns                     2/2     2            2           3d18h
kubernetes-dashboard   deployment.apps/dashboard-metrics-scraper   1/1     1            1           3d18h
kubernetes-dashboard   deployment.apps/kubernetes-dashboard        1/1     1            1           3d18h

NAMESPACE              NAME                                                   DESIRED   CURRENT   READY   AGE
default                replicaset.apps/nginx-6799fc88d8                       1         1         1       18h
kube-system            replicaset.apps/calico-kube-controllers-56b44cd6d5     0         0         0       3d18h
kube-system            replicaset.apps/calico-kube-controllers-86bddfcff      1         1         1       3d18h
kube-system            replicaset.apps/coredns-74ff55c5b                      2         2         2       3d18h
kubernetes-dashboard   replicaset.apps/dashboard-metrics-scraper-79c5968bdc   1         1         1       3d18h
kubernetes-dashboard   replicaset.apps/kubernetes-dashboard-7448ffc97b        1         1         1       3d18h
docker kubernetes load-balancing kind
3个回答
2
投票

答案不具体,从一开始就做好准备。 有一个巨大的关闭由于 docker exec cat /kind/version 失败而无法创建集群 github 问题没有解决,但是..

您遇到的问题非常广泛,并且可能有完全不同的根本原因。

BenTheElder - 善良的创建者/维护者

这部分:命令输出:来自守护程序的错误响应:容器 f2a2d9c8f9c2eca9aeec7f10249eb205b02c8a5f41e5bf1145b5a8e4b63da123 是 没有运行

这告诉我们节点容器没有运行。那要么 意味着入口点失败或者你的主机杀死了它,两者都是由于 我们还没有发现一些不起眼的错误,或者更有可能是一个问题 您的主机环境。

请提交您自己的问题并提供更多详细信息。这个问题是 不具体,并讨论了许多不同的问题,如概述的 上面。

所以请在 Github 上创建新问题,现在这个地方很可能最适合解决此类问题。

我还发现您的问题可能来自使用 Snap 安装的 Docker。请参阅https://github.com/kubernetes-sigs/kind/issues/1288#issuecomment-631673479。 SNAP 的 Docker 知道与 Kind 一起工作的问题,而且它实际上并没有得到 KIND 团队的支持

snap 在已知问题文档中,snap docker 软件包有一个 问题数量,例如无法访问临时目录。我不 推荐 docker 的 snap,但我们并不真正支持这个。


一个小提示:我们现在已经解决了大多数快照问题,如果 你只是管理集群,但我仍然不推荐使用 snap 码头工人。

如果您看到类似的问题,则表示节点容器 由于某种原因提前退出。这通常意味着宿主环境 已损坏,但有时意味着我们需要解决问题,例如较少的 具有设备映射器问题的常见文件系统。

请尝试使用 kind create cluster --retain 捕获节点日志, 导出日志,并对上传的日志提出问题。我们会尝试 根据这些来找出原因。

编辑:特别清楚:“由于 docker exec cat 无法创建集群 /kind/version failed”是一种症状,请向 有关您的具体故障的详细信息,以便我们可以确定实际的根源 因为如果你遇到这种情况。

此问题已被锁定,因为它偏离了原始根源 导致并继续用于解决恰好发生的新问题 相同的症状。此症状对于节点的边缘情况很常见 很早就突然终止,因为它是第一个 我们对正在运行的节点采取的操作。


2
投票

在修剪我的 Docker 容器后,我能够创建 Kind 集群。 我认为这可能与之前安装的 Kind 集群/容器发生冲突。

docker container rm <id-of-container>

完成此操作后,Kind create cluster 命令对我有用。

编辑
经过进一步检查,我用来创建集群的配置文件中的 YAML 格式似乎很糟糕。 我拼错了一个属性名称。

    defaults:
      enfoce: "baseline"

应该是

    defaults:
      enforce: "baseline"

当我遇到这个问题时,我正在学习 Kubernetes pod 安全教程。 https://kubernetes.io/docs/tutorials/security/cluster-level-pss/


0
投票

我在我的 Windows 机器上也遇到了类似的问题,我已经为 Docker 安装了 Rancher Desktop

我在某处读到 KIND 不适用于 Rancher,因此卸载了 Rancher 并安装了 Docker Desktop,之后一切都按预期工作。

© www.soinside.com 2019 - 2024. All rights reserved.