我正在尝试为我的 kubernetes 集群设置一个
kind
集群。不幸的是,在写入节点时准备好节点后失败了。我将附上输出和一些信息。预先感谢您的帮助!
干杯
$ kind create cluster --config kind-config.yaml
Creating cluster "kind" ...
✓ Ensuring node image (kindest/node:v1.20.2) 🖼
✓ Preparing nodes 📦 📦 📦 📦
✗ Writing configuration 📜
ERROR: failed to create cluster: failed to generate kubeadm config content: failed to get kubernetes version from node: failed to get file: command "docker exec --privileged kind-worker3 cat /kind/version" failed with error: exit status 1
Command Output: Error response from daemon: Container c41566958be2239a9470ef2ea636c4b21958ee7620086f526954a02e4a605106 is not running
apiVersion: kind.x-k8s.io/v1alpha4
kind: Cluster
nodes:
- role: control-plane
- role: worker
- role: worker
- role: worker
$ kubectl get nodes -o wide
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME
gemini Ready control-plane,master 3d18h v1.20.2 192.168.2.203 <none> Ubuntu 20.10 5.8.0-1015-raspi docker://19.3.13
phoenix Ready <none> 3d17h v1.20.2 192.168.2.129 <none> Ubuntu 20.10 5.8.0-1015-raspi docker://19.3.13
taurus Ready <none> 3d17h v1.20.2 192.168.2.201 <none> Ubuntu 20.10 5.8.0-1015-raspi docker://19.3.13
virgo Ready <none> 3d17h v1.20.2 192.168.2.202 <none> Ubuntu 20.10 5.8.0-1015-raspi docker://19.3.13
$ kubectl get all --all-namespaces
NAMESPACE NAME READY STATUS RESTARTS AGE
default pod/nginx-6799fc88d8-62cjd 1/1 Running 1 18h
kube-system pod/calico-kube-controllers-86bddfcff-ccrhg 1/1 Running 7 3d18h
kube-system pod/calico-node-jddnl 1/1 Running 4 3d17h
kube-system pod/calico-node-nxwlw 0/1 Running 7 3d18h
kube-system pod/calico-node-stnzs 0/1 Running 0 52s
kube-system pod/calico-node-zrxzl 1/1 Running 4 3d17h
kube-system pod/coredns-74ff55c5b-kb2nm 1/1 Running 7 3d18h
kube-system pod/coredns-74ff55c5b-wsgs5 1/1 Running 7 3d18h
kube-system pod/etcd-gemini 1/1 Running 8 3d18h
kube-system pod/kube-apiserver-gemini 1/1 Running 8 3d18h
kube-system pod/kube-controller-manager-gemini 1/1 Running 11 3d18h
kube-system pod/kube-proxy-7fcjz 1/1 Running 8 3d18h
kube-system pod/kube-proxy-84rr7 1/1 Running 4 3d17h
kube-system pod/kube-proxy-lc88w 1/1 Running 4 3d17h
kube-system pod/kube-proxy-v4qd9 1/1 Running 4 3d17h
kube-system pod/kube-scheduler-gemini 1/1 Running 9 3d18h
kubernetes-dashboard pod/dashboard-metrics-scraper-79c5968bdc-mlb4s 1/1 Running 7 3d18h
kubernetes-dashboard pod/kubernetes-dashboard-7448ffc97b-nq5c9 1/1 Running 7 3d18h
NAMESPACE NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
default service/kubernetes ClusterIP 10.96.0.1 <none> 443/TCP 41h
kube-system service/calico-etcd ClusterIP 10.96.232.136 <none> 6666/TCP 3d18h
kube-system service/calico-typha ClusterIP 10.109.108.233 <none> 5473/TCP 3d18h
kube-system service/kube-dns ClusterIP 10.96.0.10 <none> 53/UDP,53/TCP,9153/TCP 3d18h
kubernetes-dashboard service/dashboard-metrics-scraper ClusterIP 10.110.70.52 <none> 8000/TCP 3d18h
kubernetes-dashboard service/kubernetes-dashboard NodePort 10.106.194.127 <none> 443:31741/TCP 3d18h
NAMESPACE NAME DESIRED CURRENT READY UP-TO-DATE AVAILABLE NODE SELECTOR AGE
kube-system daemonset.apps/calico-node 4 4 2 4 2 kubernetes.io/os=linux 3d18h
kube-system daemonset.apps/kube-proxy 4 4 4 4 4 kubernetes.io/os=linux 3d18h
NAMESPACE NAME READY UP-TO-DATE AVAILABLE AGE
default deployment.apps/nginx 1/1 1 1 18h
kube-system deployment.apps/calico-kube-controllers 1/1 1 1 3d18h
kube-system deployment.apps/coredns 2/2 2 2 3d18h
kubernetes-dashboard deployment.apps/dashboard-metrics-scraper 1/1 1 1 3d18h
kubernetes-dashboard deployment.apps/kubernetes-dashboard 1/1 1 1 3d18h
NAMESPACE NAME DESIRED CURRENT READY AGE
default replicaset.apps/nginx-6799fc88d8 1 1 1 18h
kube-system replicaset.apps/calico-kube-controllers-56b44cd6d5 0 0 0 3d18h
kube-system replicaset.apps/calico-kube-controllers-86bddfcff 1 1 1 3d18h
kube-system replicaset.apps/coredns-74ff55c5b 2 2 2 3d18h
kubernetes-dashboard replicaset.apps/dashboard-metrics-scraper-79c5968bdc 1 1 1 3d18h
kubernetes-dashboard replicaset.apps/kubernetes-dashboard-7448ffc97b 1 1 1 3d18h
答案不具体,从一开始就做好准备。 有一个巨大的关闭由于 docker exec cat /kind/version 失败而无法创建集群 github 问题没有解决,但是..
您遇到的问题非常广泛,并且可能有完全不同的根本原因。
这部分:命令输出:来自守护程序的错误响应:容器 f2a2d9c8f9c2eca9aeec7f10249eb205b02c8a5f41e5bf1145b5a8e4b63da123 是 没有运行
这告诉我们节点容器没有运行。那要么 意味着入口点失败或者你的主机杀死了它,两者都是由于 我们还没有发现一些不起眼的错误,或者更有可能是一个问题 您的主机环境。
请提交您自己的问题并提供更多详细信息。这个问题是 不具体,并讨论了许多不同的问题,如概述的 上面。
所以请在 Github 上创建新问题,现在这个地方很可能最适合解决此类问题。
我还发现您的问题可能来自使用 Snap 安装的 Docker。请参阅https://github.com/kubernetes-sigs/kind/issues/1288#issuecomment-631673479。 SNAP 的 Docker 知道与 Kind 一起工作的问题,而且它实际上并没有得到 KIND 团队的支持
snap 在已知问题文档中,snap docker 软件包有一个 问题数量,例如无法访问临时目录。我不 推荐 docker 的 snap,但我们并不真正支持这个。
一个小提示:我们现在已经解决了大多数快照问题,如果 你只是管理集群,但我仍然不推荐使用 snap 码头工人。
如果您看到类似的问题,则表示节点容器 由于某种原因提前退出。这通常意味着宿主环境 已损坏,但有时意味着我们需要解决问题,例如较少的 具有设备映射器问题的常见文件系统。
请尝试使用 kind create cluster --retain 捕获节点日志, 导出日志,并对上传的日志提出问题。我们会尝试 根据这些来找出原因。
编辑:特别清楚:“由于 docker exec cat 无法创建集群 /kind/version failed”是一种症状,请向 有关您的具体故障的详细信息,以便我们可以确定实际的根源 因为如果你遇到这种情况。
此问题已被锁定,因为它偏离了原始根源 导致并继续用于解决恰好发生的新问题 相同的症状。此症状对于节点的边缘情况很常见 很早就突然终止,因为它是第一个 我们对正在运行的节点采取的操作。
在修剪我的 Docker 容器后,我能够创建 Kind 集群。 我认为这可能与之前安装的 Kind 集群/容器发生冲突。
docker container rm <id-of-container>
完成此操作后,Kind create cluster 命令对我有用。
编辑:
经过进一步检查,我用来创建集群的配置文件中的 YAML 格式似乎很糟糕。 我拼错了一个属性名称。
defaults:
enfoce: "baseline"
应该是
defaults:
enforce: "baseline"
当我遇到这个问题时,我正在学习 Kubernetes pod 安全教程。 https://kubernetes.io/docs/tutorials/security/cluster-level-pss/
我在我的 Windows 机器上也遇到了类似的问题,我已经为 Docker 安装了 Rancher Desktop。
我在某处读到 KIND 不适用于 Rancher,因此卸载了 Rancher 并安装了 Docker Desktop,之后一切都按预期工作。