我正在使用 Qdrant 来存储向量和有效负载。例如我的文档是这样的:
{ "id": 1234,
"title": "my_title",
"description": "my_description",
"keywords": [..],
"contacts": "email"
Vector: embedding(title)
}
目前我已将近 500 个数据点存储到集合中。我正在使用矢量搜索检索数据,将用户的输入与矢量场(即标题的嵌入)进行比较。看起来效果很好。但是,我想知道使用以下说明在标题字段上创建有效负载索引有什么优点:
PUT /collections/my_collectino/index
{
"field_name": "title",
"field_schema": "text"
}
此操作会影响搜索速度还是仅影响检索质量?
它会影响“标题”字段的过滤速度。 例如,如果您想引入向量和关键字搜索的一些组合,即标题中有一些关键字(品牌名称),并且您想使用 Qdrant 的过滤机制对其进行过滤,则对有效负载字段建立索引是有意义的。 (更多信息请参见:https://qdrant.tech/articles/vector-search-filtering/)
对有效负载字段进行索引不会影响矢量搜索的速度,正如我所知,您现在正在执行矢量搜索:)