当前,我已经在ElasticSearch中为许多文档建立了索引,当我对最大分数进行搜索时,该数字超过了1。
如何获得介于0和1之间的相似度搜索?
我应该更好地配置ElasticSearch吗?还是应该更改我的映射?
感谢您的建议。
Lucene评分不是基于tif id向量的经典余弦相似度函数,但是在进行某些修改时会考虑到其他因素,例如字段或查询项的提升。您可以在page上阅读有关计分公式的模式详细信息。因此,最简单的方法是在Elasticsearch响应中的max_score上获得分数(介于0.0和1.0之间)(与第一个文档的分数一致)。
您能否更准确地解释您的意思?