数据协调器无法启动。卡在“正在初始化”

问题描述 投票:0回答:1

我有一堆看起来像这样的日志

[2024/07/01 17:42:53.684 +00:00] [WARN] [datacoord/index_service.go:849] ["DataCoord 12139 is not ready"] [traceID=1a56c8bd789bd9dde94e8fdee0e927c1] [collectionID=448339039224594620] [error="service not ready[datacoord=12139]: Initializing"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=9d4c0a04cc578a1abeba6a9bbe0fbccb] [collectionID=448339039224915395] [partitionIDs="[]"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=ff858e069b81baa6cfbad28caa1e28fe] [collectionID=448339039243990697] [partitionIDs="[]"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=3a528ee771464452f5479a8d290f5822] [collectionID=448339039224854911] [partitionIDs="[]"]

基本上重复这个过程,直到 k8s 部署放弃等待就绪并杀死 pod。 我使用的是 milvus 2.3.10 和官方 Helm Chart 的 4.1.21 版本。 我正在寻找有关调试这里发生的情况以及如何尝试恢复的任何建议,或者至少了解有关该问题的更多信息。 据我所知,其他组件的日志看起来相对正常。 谢谢!

vector-database milvus
1个回答
0
投票

故障排除步骤如下:

  1. 检查 Milvus 的依赖关系,如 etcd、消息队列(Pulsar/Kafka)、对象存储等,确保其正常工作。
  2. 检查根坐标是否正常工作。

您可以使用 https://github.com/milvus-io/milvus/blob/master/deployments/export-log/export-milvus-log.sh 中的脚本将日志上传给我们。

© www.soinside.com 2019 - 2024. All rights reserved.