Elasticsearch在双引号外标记化

问题描述 投票:1回答:1

我具有按如下方式创建的映射的elasticsearch。

PUT /test
{
  "settings":{
      "analysis":{
         "analyzer":{
            "my_analyzer":{
               "filter":[
                  "lowercase"
               ],
               "type":"custom",
               "tokenizer":"my_tokenizer"
            }
         },
         "tokenizer": {
           "my_tokenizer": {
             "type": "char_group",
             "tokenize_on_chars": [
                "whitespace",
                ":"
              ]
           }
         }
      }
   },
   "mappings":{
      "properties":{
         "data":{
            "type":"text",
            "analyzer":"my_analyzer"
         }
      }
   }
}

我想做的是在遇到:字符时创建一个新令牌,并将其从数据中删除。但是我只想在双引号(“)之外使用它。有什么方法可以实现?

elasticsearch search elasticsearch-analyzers
1个回答
0
投票

[我想您可以尝试使用regexp和模式令牌生成器(https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-tokenizer.html)来表达它,或者...亲自编写令牌生成器并尝试将其添加到您的Elasticsearch安装中。

© www.soinside.com 2019 - 2024. All rights reserved.