LuceneSolr搜索文档创建[关闭]

问题描述 投票:0回答:1

我正在使用Lucene在一个网站上构建一个搜索功能。我想了解以下的事情,以便更清楚地了解

  1. 每当创建一个新的网页时,我是否每次都要在lucene中创建一个带有字段的等价文档?
  2. 有什么截图图片说明lucene文档是怎样的吗?
  3. 一旦做了倒置索引,是存储在DB中还是json中?
  4. 是否应该根据我们的业务关键词,手动制作自动校正器词典?
elasticsearch search solr lucene
1个回答
1
投票

这些分别是对你问题的回答。

  1. 是的,当然,只要你添加或创建了一个文档(这里指的是网页),你就应该尽快给它建立索引,使其可以被搜索到。
  2. Lucene的文档是现实世界中的概念,所以一个文档是指由一组字段组成的文档(例如一个网页就是一个包含 "标题"、"正文"、"标签 "和 "评论 "的文档)。因此,为了使这个文档可以被搜索,我们创建一个lucene文档,并告诉Lucene给它编索引。如果你熟悉编程的话,Lucene documnet是个 class 与一些字段。

Lucene Document declaration in java

  1. 是的,当然,但不是用json存储的。有一组文件构成了索引,从一个角度来看,它看起来像json(因为它存储在硬盘上),但不是真正的json。它是由这些格式组成的(segments.gen, segments_N, write.lock, .cfs, .fnm等等,你可以在其中查看 此处)

Lucene index files

  1. 你可以添加自己的字典校正器,同时使用默认的。
© www.soinside.com 2019 - 2024. All rights reserved.