SO中文参考
首页
(current)
程序语言
c
java
python
c++
go
javascript
swift
c#
操作系统
linux
ubuntu
centos
unix
数据库
oracle
mysql
mongodb
postgresql
框架
node.js
angular
react-native
avalon
django
twisted
hadoop
.net
移动开发
android
ios
搜索
LuceneSolr搜索文档创建[关闭]
问题描述
投票:0
回答:1
我正在使用Lucene在一个网站上构建一个搜索功能。我想了解以下的事情,以便更清楚地了解
每当创建一个新的网页时,我是否每次都要在lucene中创建一个带有字段的等价文档?
有什么截图图片说明lucene文档是怎样的吗?
一旦做了倒置索引,是存储在DB中还是json中?
是否应该根据我们的业务关键词,手动制作自动校正器词典?
elasticsearch
search
solr
lucene
1个回答
1
投票
这些分别是对你问题的回答。
是的,当然,只要你添加或创建了一个文档(这里指的是网页),你就应该尽快给它建立索引,使其可以被搜索到。
Lucene的文档是现实世界中的概念,所以一个文档是指由一组字段组成的文档(例如一个网页就是一个包含 "标题"、"正文"、"标签 "和 "评论 "的文档)。因此,为了使这个文档可以被搜索,我们创建一个lucene文档,并告诉Lucene给它编索引。如果你熟悉编程的话,Lucene documnet是个
class
与一些字段。
是的,当然,但不是用json存储的。有一组文件构成了索引,从一个角度来看,它看起来像json(因为它存储在硬盘上),但不是真正的json。它是由这些格式组成的(segments.gen, segments_N, write.lock, .cfs, .fnm等等,你可以在其中查看
此处
)
你可以添加自己的字典校正器,同时使用默认的。
最新问题
MSTest 在不应该运行时忽略了测试
useMatch 用于在react-router-dom 中测试多种模式
Chart.js 3.9 和 Vue:无法处理 onClick 事件
将 S3 协议与 Supabase 存储一起使用时出现 Golang AWS SDK v2 SignatureDoesNotMatch 错误
AudioManager 上下文,Android Kotlin 片段
使用 dplyr 时 if_else(返回太长的向量)和 case_when 的区别
如何在FlowLayoutPanel控件中实现分页效果?
如何在c#中的数据网格中禁用多选选项
“声明反映使用”规则是否适用于 C++ 引用变量?
如何将字符串转换为浮点数而不影响逗号后面的数字?
Stripe payment_intent 成功事件不包含发票 ID
Flutter 运行错误 - 找不到 io.flutter:x86_64_debug:1.0.0
ORACLE中Update语句的性能调优
游戏对象的父子关系和解除父子关系
Android 检查 LocationManager 的权限
Python 中的哈希图和哈希表有什么区别?
在 VSCode 中执行与 ENTER 相反的键盘快捷键(取消缩进并删除换行)?
Langchain FastEmbed 与 ChromaDB
如何创建LiveSwitch.TextControl.Editor对象? - C#
在另一个项目中构建库时,构建系统找不到引用,为什么?
© www.soinside.com 2019 - 2024. All rights reserved.