我正计划实施二元模型模型来预测搜索文本。如果用户经常搜索“测试搜索词”,然后用户键入“测试”,则希望自动建议“测试搜索词”
我有搜索到的文本的数据列表。我正在尝试使用Bi-gram,即使用户键入“ Tast”,它仍应提供“ Test search word”。我正在用Java实现它。我正在寻找一个提供我所拥有的数据的库,当我通过键入文本的用户时,它应该提供预测。
经过研究,我发现下面的链接
https://opennlp.apache.org/docs/1.8.1/apidocs/opennlp-tools/opennlp/tools/ngram/NGramUtils.html
但是他们对我的情况没有帮助。任何人都可以请适合我目的的Java库信息,或者遇到这种情况的人?
我正在考虑两种解决方案:
第一
现在对每个新用户查询q
,获取在MARISA TRIE中将您的查询q
设置为prefix的所有字符串索引(在拼写公差之后)。
第二
使用Elasticsearch建议者
请注意,建议功能的某些部分仍在开发中。
希望有所帮助