我最近一直在阅读Designing Data-Intensive Applications。在第6章分区(sharding)中,作者谈到了存储系统对二级索引的需求。作者特别说:
最后,二级索引是 Solr 和 Elasticsearch 等搜索服务器存在的理由。
我对此很困惑。我认为搜索引擎使用倒排索引而不是正向索引,它有效地在每个单词而不是文档的某些主键上创建索引。那么为什么需要二级索引呢?
倒排索引是一种二级索引。
我们需要二级索引来加速我们的系统并提供特殊功能,例如在正向索引中搜索。