我发现它支持17种语言,但是Tantivy是如何解决这个问题的呢?它在幕后使用什么词干分析器?
PostgreSQL使用Snowball实现全文搜索https://snowballstem.org/demo.html 支持29种语言。
如何使用 Tantivy 来应用 Snowball 词干提取器?支持雪球吗?
它在引擎盖下使用什么词干分析器?
揭开引擎盖,发现 Tantivy 目前依赖于
rust-stemmers
中的词干分析器。
[dependencies]
# ...
rust-stemmers = "1.2.0"
rust-stemmers
有详细记录为多种语言提供 Snowball 词干分析器:
这个板条箱实现了 snowball 项目中找到的一些词干分析器算法,这些算法使用 snowball 编译器的 rust 后端编译为 rust。