我有一堆看起来像这样的日志
[2024/07/01 17:42:53.684 +00:00] [WARN] [datacoord/index_service.go:849] ["DataCoord 12139 is not ready"] [traceID=1a56c8bd789bd9dde94e8fdee0e927c1] [collectionID=448339039224594620] [error="service not ready[datacoord=12139]: Initializing"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=9d4c0a04cc578a1abeba6a9bbe0fbccb] [collectionID=448339039224915395] [partitionIDs="[]"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=ff858e069b81baa6cfbad28caa1e28fe] [collectionID=448339039243990697] [partitionIDs="[]"]
[2024/07/01 17:42:53.746 +00:00] [INFO] [datacoord/services.go:797] ["get recovery info request received"] [traceID=3a528ee771464452f5479a8d290f5822] [collectionID=448339039224854911] [partitionIDs="[]"]
基本上重复这个过程,直到 k8s 部署放弃等待就绪并杀死 pod。 我使用的是 milvus 2.3.10 和官方 Helm Chart 的 4.1.21 版本。 我正在寻找有关调试这里发生的情况以及如何尝试恢复的任何建议,或者至少了解有关该问题的更多信息。 据我所知,其他组件的日志看起来相对正常。 谢谢!
故障排除步骤如下:
您可以使用 https://github.com/milvus-io/milvus/blob/master/deployments/export-log/export-milvus-log.sh 中的脚本将日志上传给我们。