我使用弹性搜索 7.10,喜欢通过对分析字段进行通配符搜索来查找文档,并突出显示文本中的内容。但这不起作用。
该文档可以包含以下示例:
"The color of the car is black."
我期望得到标记 car
和 black
的结果。
我有以下映射:
"text": {
"type": "text",
"store": true,
"term_vector": "with_positions_offsets",
"analyzer": "my_analyzer",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 8000
},
"wc" :{
"type": "wildcard"
}
}
},
我使用以下查询:
{
"query": {
"bool": {
"should": [
{
"match": {"text": "car"}
},
{
"wildcard": { "text.wc": { "value": "bl*" } }
}
]
}
},
"fields": ["text", "text.wc"],
"highlight": {
"pre_tags": [
"<span class='marker'>"
],
"post_tags": [
"</span>"
],
"type": "fvh",
"fields": {
"*": {
"pre_tags": [
"<em>"
],
"post_tags": [
"</em>"
]
}
},
"require_field_match": true
}
}
查询结果集中仅包含
text
- 字段的高亮显示,而不包含 text.wc
字段的高亮显示。我还尝试了一个单独的通配符字段,它不是 text
的子字段,但这也不起作用。我还注意到,需要将 _source
- 字段设置为 enabled
,即使所有字段都设置为存储,否则我会收到 Unable to retrieve the requested [fields]
消息。
问题:如何获取通配符搜索词的突出显示文本?
我找到了解决方案,并想自己回答我的问题,以防有人面临同样的问题。
答案是,通配符、突出显示和文本分析(如词干提取)不适用于
match
和 wildcard
- 像上面这样的查询。
但是:您可以使用
match
代替 wildcard
和 query_string
。这是弹性查询 DSL 的一部分,但不幸的是这里没有列出:https://www.elastic.co/guide/en/elasticsearch/reference/7.16/query-dsl.html
在我看来,这个非常重要的功能位于此处更深的 2 个基本点击/级别:https://www.elastic.co/guide/en/elasticsearch/reference/7.16/query-dsl-query-string-query.html
query_string
允许您在分析字段上执行所有搜索并突出显示内容,就像来自 solr
的人员在查询中所做的那样。
一个例子如下:
"query": {
"bool": {
"should": [
{
"query_string": {
"fields": [
"text"
],
"query": "car and bl*"
}
]
}
}
"highlight": {
"pre_tags": [
"<span class='marker'>"
],
"post_tags": [
"</span>"
],
"type": "fvh",
"fields": {
"*": {
"pre_tags": [
"<em>"
],
"post_tags": [
"</em>"
]
}
},
"require_field_match": true
}
}