solr 相关问题

Apache Solr是一个基于Lucene Java搜索库的开源搜索服务器。

Solr 无法索引文本字段

尝试使用 text_general 字段索引文档时，出现以下错误：将文档 id 93cf6aeb-54b0-471a-9325-5b8e95801131 写入索引时出现异常；可能的分析错误：不能...

solr lucene full-text-search

回答 2 投票 0

Solr 中的全外连接

我正在尝试对两个集合进行完整的外部联接。给定 collection1 的文档如下所示： { 身份证号：234982032，名称：示例，列表编号：123 } 和 collection2 的文档...

java solr lucene solrcloud

回答 2 投票 0

SolrCloud 无法连接超过 1 个节点

我正在尝试使用 Solr 6.2.0 和 Zookeeper 3.4.8 创建带有 Vagrant 框的 SolrCloud 设置我设法让它与 Solr 6.1.0 完美配合，但我无法启动超过一个节点...

solr apache-zookeeper solrcloud

回答 1 投票 0

Solr |突出显示返回所有不匹配的字段

我正在使用 solr -7.x 我正在使用这样的突出显示功能。查询：/search?q=australia&collection=jeep-au&wt=json&start=0&hl=on&hl.fl=标题、描述、关键字&hl.me...

solr highlight

回答 1 投票 0

使用 jq 展平嵌套 JSON

我想展平嵌套的 json 对象，例如{"a":{"b":1}} 到 {"a.b":1} 以便在 solr 中消化它。我有 11 TB 的 json 文件，它们都是嵌套的，并且字段名称中包含点，这意味着......

json elasticsearch solr jq flatten

回答 6 投票 0

更新 Solr 中的多值字段

我是 Solr 新手，所以我可能做错了事情。截至目前，我添加了这样的文档： curl -X POST -H“内容类型：application/json”“http://localhost:8983/solr/my_core/update？

solr

回答 1 投票 0

Solr 对多值字段进行排序会在多分片环境中产生 Bytesref 错误

Solr 8.11（在 SolrCloud 模式下）在使用排序参数 sort=field("RECORD_DATE") asc 查询时返回 500 错误。错误信息是： java.lang.String 类无法转换为 org 类。

solr solrcloud solr8

回答 1 投票 0

solr 通过curl POST 请求创建密集向量场

我想使用 solr 中的新功能，即 DensevectorField，但我看不到任何可以通过curl 发布架构来创建此字段类型的示例。通常情况下，我会这样做...

solr

回答 1 投票 0

使用证书认证插件访问Solr 9失败

我目前正在建立一个新的 Solr 9（确切地说是 9.2）集群。截至目前，我有 2 个 Solr 节点、1 个外部 ZooKeeper，并且我的索引中有文档。一旦我完成了这项工作，我...

solr postman ssl-certificate apache-zookeeper solrcloud

回答 1 投票 0

Solr：使用快速入门指南找不到 SimplePostTool 错误

我正在学习 Solr 并使用快速入门指南。使用以下命令将示例文档发布到 Solr 核心时： java -jar -Dc=techproducts example/exampledocs/post.jar *.xml 我明白了

java solr solr9 solr-9.3.0

回答 1 投票 0

我无法让我的项目（dotnet 6.0）与Solr 8.9连接，我希望有人可以帮助我

程序.cs ... builder.Services.AddSolrNet("http://localhost:8983/solr/fast").BuildServiceProvider(); builder.Services.AddHttpContextAccessor(); // 添加瞬态布...

asp.net asp.net-mvc asp.net-web-api solr solrnet

回答 1 投票 0

Solr Core 的原子更新：防止由于一些文档丢失而导致批量失败

我在使用批处理 python 脚本时遇到 Solr 核心中的原子更新问题。该脚本将 10000 个文档的数据批量发送到 Solr 核心进行原子更新，...

json indexing solr solrcloud

回答 1 投票 0

从 Solr 查询中得到奇怪的结果

我正在使用 Datastax 6.8。这是我的 SOLR 架构：我正在使用 Datastax 6.8。这是我的 SOLR 架构： <?xml version="1.0" encoding="UTF-8" standalone="no"?> <schema name="autoSolrSchema" version="1.5"> <types> <fieldType class="org.apache.solr.schema.StrField" name="StrField"/> <fieldType class="org.apache.solr.schema.TextField" name="NameField"> <analyzer type="index"> <filter class="solr.ASCIIFoldingFilterFactory"/> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> </fieldType> </types> <fields> <field indexed="true" multiValued="false" name="nama" type="StrField"/> <field indexed="true" multiValued="false" name="nama_copy" type="NameField"/> </fields> <uniqueKey>(nama)</uniqueKey> <copyField dest="nama_copy" source="nama"/> </schema> 我连续有这个字段值batamindo v 然后我运行了这个查询 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ v 我得到了非常好的结果 { "responseHeader":{ "status":0, "QTime":8}, "response":{"numFound":579,"start":0,"docs":[ { "nama":"BATAMINDO V "}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}] }} 但是当我跑步时 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ vi 我的搜索结果非常糟糕 { "responseHeader":{ "status":0, "QTime":14}, "response":{"numFound":602,"start":0,"docs":[ { "nama":"MV. VINCA"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINCENT TRADER"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"NAVI SUNNY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MT. GOLDEN VIOLET"}, { "nama":"MT. GOLDEN VIOLET"}] }} 这里发生了什么？您所看到的是预期行为。 NGramFilterFactory类将字符串标记为N大小的克。在您的情况下，字符串根据您的架构定义被分成 2 到 15 个字符的克： <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> 对于像 cassandra 这样的输入字符串，N 元语法过滤器会生成以下语法：大小=2：ca as ss sa an nd dr ra 大小=3：cas ass ssa san and ndr dra 大小=4：cass assa ssan sand andr ndra 依此类推，直到大小=15 对于搜索词 ss，Solr 查询将获得 ss、ass、ssa、assa、ssan 等的匹配项。在您的搜索词为 vi 的情况下，预计会匹配 vinca、vinaship、vincent、victory、navi、violet 等。有关更多信息，请参阅Solr 中的文档分析。干杯！

cassandra solr lucene datastax-enterprise

回答 1 投票 0

根据其他字段设置solr字段值

我在Solr核心中有三个字段：字段1，字段2, 字段3。我正在 DIH 中为 Field1 和 Field2 设置值，但我想根据 Field1 和 Fiel 中的某些值设置 Field3 的值...

solr solr8

回答 1 投票 0

Solr：查询子字符串匹配

我们收到一个以逗号分隔的关键字列表，如下所示：品牌电视、手机、平板电脑品牌技术、电话上述每一项都对应一个 Solr 文档。我们想要实现的是以下...

solr

回答 1 投票 0

SolrCloud 支持分片之间的 Join 查询吗？

我已经设置了一个具有 2 个节点、2 个分片和 2 个副本的 SolrCloud。我的 Join 查询在单个 solr 实例中工作正常，但此 SolrCloud 设置存在一些问题。 fq = {!从=student_id_i加入到=