Apache Solr是一个基于Lucene Java搜索库的开源搜索服务器。
尝试使用 text_general 字段索引文档时,出现以下错误: 将文档 id 93cf6aeb-54b0-471a-9325-5b8e95801131 写入索引时出现异常;可能的分析错误:不能...
我正在尝试对两个集合进行完整的外部联接。给定 collection1 的文档如下所示: { 身份证号:234982032, 名称: 示例, 列表编号:123 } 和 collection2 的文档...
我正在尝试使用 Solr 6.2.0 和 Zookeeper 3.4.8 创建带有 Vagrant 框的 SolrCloud 设置 我设法让它与 Solr 6.1.0 完美配合,但我无法启动超过 一个节点...
我正在使用 solr -7.x 我正在使用这样的突出显示功能。 查询:/search?q=australia&collection=jeep-au&wt=json&start=0&hl=on&hl.fl=标题、描述、关键字&hl.me...
我想展平嵌套的 json 对象,例如{"a":{"b":1}} 到 {"a.b":1} 以便在 solr 中消化它。 我有 11 TB 的 json 文件,它们都是嵌套的,并且字段名称中包含点,这意味着......
我是 Solr 新手,所以我可能做错了事情。截至目前,我添加了这样的文档: curl -X POST -H“内容类型:application/json”“http://localhost:8983/solr/my_core/update?
Solr 对多值字段进行排序会在多分片环境中产生 Bytesref 错误
Solr 8.11(在 SolrCloud 模式下)在使用排序参数 sort=field("RECORD_DATE") asc 查询时返回 500 错误。 错误信息是: java.lang.String 类无法转换为 org 类。
我想使用 solr 中的新功能,即 DensevectorField,但我看不到任何可以通过curl 发布架构来创建此字段类型的示例。 通常情况下,我会这样做...
我目前正在建立一个新的 Solr 9(确切地说是 9.2)集群。 截至目前,我有 2 个 Solr 节点、1 个外部 ZooKeeper,并且我的索引中有文档。 一旦我完成了这项工作,我...
Solr:使用快速入门指南找不到 SimplePostTool 错误
我正在学习 Solr 并使用快速入门指南。使用以下命令将示例文档发布到 Solr 核心时: java -jar -Dc=techproducts example/exampledocs/post.jar *.xml 我明白了
我无法让我的项目(dotnet 6.0)与Solr 8.9连接,我希望有人可以帮助我
程序.cs ... builder.Services.AddSolrNet("http://localhost:8983/solr/fast").BuildServiceProvider(); builder.Services.AddHttpContextAccessor(); // 添加瞬态 布...
Solr Core 的原子更新:防止由于一些文档丢失而导致批量失败
我在使用批处理 python 脚本时遇到 Solr 核心中的原子更新问题。该脚本将 10000 个文档的数据批量发送到 Solr 核心进行原子更新,...
我正在使用 Datastax 6.8。这是我的 SOLR 架构: 我正在使用 Datastax 6.8。这是我的 SOLR 架构: <?xml version="1.0" encoding="UTF-8" standalone="no"?> <schema name="autoSolrSchema" version="1.5"> <types> <fieldType class="org.apache.solr.schema.StrField" name="StrField"/> <fieldType class="org.apache.solr.schema.TextField" name="NameField"> <analyzer type="index"> <filter class="solr.ASCIIFoldingFilterFactory"/> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> </fieldType> </types> <fields> <field indexed="true" multiValued="false" name="nama" type="StrField"/> <field indexed="true" multiValued="false" name="nama_copy" type="NameField"/> </fields> <uniqueKey>(nama)</uniqueKey> <copyField dest="nama_copy" source="nama"/> </schema> 我连续有这个字段值batamindo v 然后我运行了这个查询 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ v 我得到了非常好的结果 { "responseHeader":{ "status":0, "QTime":8}, "response":{"numFound":579,"start":0,"docs":[ { "nama":"BATAMINDO V "}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}] }} 但是当我跑步时 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ vi 我的搜索结果非常糟糕 { "responseHeader":{ "status":0, "QTime":14}, "response":{"numFound":602,"start":0,"docs":[ { "nama":"MV. VINCA"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINCENT TRADER"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"NAVI SUNNY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MT. GOLDEN VIOLET"}, { "nama":"MT. GOLDEN VIOLET"}] }} 这里发生了什么? 您所看到的是预期行为。 NGramFilterFactory类将字符串标记为N大小的克。在您的情况下,字符串根据您的架构定义被分成 2 到 15 个字符的克: <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> 对于像 cassandra 这样的输入字符串,N 元语法过滤器会生成以下语法: 大小=2:ca as ss sa an nd dr ra 大小=3:cas ass ssa san and ndr dra 大小=4:cass assa ssan sand andr ndra 依此类推,直到大小=15 对于搜索词 ss,Solr 查询将获得 ss、ass、ssa、assa、ssan 等的匹配项。 在您的搜索词为 vi 的情况下,预计会匹配 vinca、vinaship、vincent、victory、navi、violet 等。 有关更多信息,请参阅Solr 中的文档分析。干杯!
我在Solr核心中有三个字段: 字段1, 字段2, 字段3。 我正在 DIH 中为 Field1 和 Field2 设置值,但我想根据 Field1 和 Fiel 中的某些值设置 Field3 的值...
我们收到一个以逗号分隔的关键字列表,如下所示: 品牌电视、手机、平板电脑 品牌 技术、电话 上述每一项都对应一个 Solr 文档。我们想要实现的是以下...
我已经设置了一个具有 2 个节点、2 个分片和 2 个副本的 SolrCloud。 我的 Join 查询在单个 solr 实例中工作正常,但此 SolrCloud 设置存在一些问题。 fq = {!从=student_id_i加入到=
我有两个收藏: 具有两个分片(shard1、shard2)的 CollectionOne 具有 id、name 和 Address 字段 带有分片(shard1、shard2)的 CollectionTwo 具有 c_id、code 和 State 字段。 我想要 r...
我正在从 docker 运行 solr 9.3 并尝试与 django-haystack 集成。 我无法配置 solrconfig.xml 和 schema.xml,并且不确定在哪里添加这些文件。 我尝试生成方案...
我正在尝试编写一个查询,以便对于以下任何查询 大象 大象很大 大象是最大的陆地哺乳动物。 Solr 应该能够返回以下结果 大象...
我是 solr 的新手,我想按子文档最低价格对父文档进行排序。请参阅下面提到的示例数据。 { “父母ID”:1, “孩子们”: { “发现数”:2, “开始”:...