我想在Lucene中处理撇号。让我们举个例子。我有以下句子:“ L'arbre est vert”。我想知道如何在不带撇号的情况下对单词“ arbre”创建查询。使用StandardAnalyzer,我需要写“ L'arbre”来获得肯定的答案。
请注意,这里有一个问题:Lucene Indexing to ignore apostrophes。但是,由于我在Lucene中还很陌生,所以我想举一个例子(在Lucene 5.3中可用的代码段)。
似乎您需要对法语进行更可靠分析的内容。我会考虑使用FrenchAnalyzer。 StandardAnalyzer旨在提供与语言无关的可传递分析。如果要对特定语言进行更智能的语言分析,则应使用该语言的分析器。
对于“ L'arbre est vert”,StandardAnalyzer将其标记为:
FrenchAnalyzer给您的地方:
正如@femtoRgon所指出的,您需要通过更适当的分析来解决此需求。您可以根据特定文档/查询的语言来更改字段的分析器,也可以选择使用语言特定的索引或字段来选择更高级的策略。
请参阅Multilingual Search using Lucene以获得可能策略的概述。