ElasticSearch - 无法使用模糊匹配查询搜索值中的下划线（ES Fuzzy 不匹配下划线值）

Question

假设我的elasticsearch中有三个文档。例如：

1: {
    "name": "test_2602"
   }
2: {
    "name": "test-2602"
   }
3: {
    "name": "test 2602"
   }

现在，当我使用模糊匹配查询搜索它时，如下所示

{
  "query": {
    "bool": {
      "must": [
        {
          "bool": {
            "must": [
              {
                "match": {
                  "name": {
                    "query": "test-2602",
                    "fuzziness": "2",
                    "prefix_length": 0,
                    "max_expansions": 50,
                    "fuzzy_transpositions": true,
                    "lenient": false,
                    "zero_terms_query": "NONE",
                    "boost": 1
                  }
                }
              }
            ],
            "disable_coord": false,
            "adjust_pure_negative": true,
            "boost": 1
          }
        }
      ],
      "disable_coord": false,
      "adjust_pure_negative": true,
      "boost": 1
    }
  }
}

作为回应，我只得到两个文档（即使我按名称值搜索 =>“test”、“test 2602”或“test-2602”）

  {
    "name": "test-2602"
  },
  {
    "name": "test 2602"
  }

我没有得到名称为“test_2602”的文档（与包含下划线的值不匹配）。我希望它包含第三个文档以及名称值为“test_2602”的文档。但是如果我搜索名称为“test_2602”，那么我会得到回应

 {
   "name": "test_2602"
 }

每当我搜索名称为“test”、“test 2602”、“test-2602”和“test_2602”时，我需要获取所有三个文档

Answer 1

您在搜索中只获得两个文档，因为默认情况下，elasticsearch 使用标准分析器，它将把

"test-2602"

和

"test 2602"

标记为

test

和

。但

"test_2602"

不会被代币化。

您可以使用analyze API查看生成的token：

GET /_analyze

{
  "analyzer" : "standard",
  "text" : "test_2602"
}

生成的代币将是：

{
  "tokens": [
    {
      "token": "test_2602",
      "start_offset": 0,
      "end_offset": 9,
      "type": "<ALPHANUM>",
      "position": 0
    }
  ]
}

您需要将

.keyword

添加到类型字段。这使用关键字分析器而不是标准分析器（请注意名称字段后的

.keyword

）。尝试以下查询。

索引映射：

{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      }
    }
  }
}

搜索查询：

{
  "query": {
    "match": {
      "name.keyword": {
        "query": "test_2602",
        "fuzziness":2
      }
    }
  }
}

搜索结果：

"hits": [
      {
        "_index": "66572330",
        "_type": "_doc",
        "_id": "1",
        "_score": 0.9808291,
        "_source": {
          "name": "test_2602"
        }
      },
      {
        "_index": "66572330",
        "_type": "_doc",
        "_id": "3",
        "_score": 0.8718481,
        "_source": {
          "name": "test 2602"
        }
      },
      {
        "_index": "66572330",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.8718481,
        "_source": {
          "name": "test-2602"
        }
      }
    ]

ElasticSearch - 无法使用模糊匹配查询搜索值中的下划线（ES Fuzzy 不匹配下划线值）

问题描述投票：0回答：1

1个回答

最新问题

ElasticSearch - 无法使用模糊匹配查询搜索值中的下划线（ES Fuzzy 不匹配下划线值）

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1