information-retrieval 相关问题

信息检索是一个研究领域,涉及从非结构化或半结构化数据集合中检索文档,信息或元数据。

使用 URL 或服务嵌入 Huggingface 教练

目前我使用 Astro Airflow 将文档插入数据库向量。问题是当我想调用instructor-xl时,总是出错: 正在下载 (…)7f436/tokenizer.json: 100%|##########| 2.4...

回答 1 投票 0

矢量数据库和全文搜索有什么区别?

我目前正在为我的个人文档构建一个信息搜索系统,并且我一直在阅读向量数据库(关于LangChain之类的东西)和全文

回答 1 投票 0

拆分查询还是使用原始查询在矢量数据库中搜索?

例如我有一个查询“纽约的中餐馆” 我希望查询结果中出现更多不同的单词,越多越好 拆分查询 ["chinese", "resturan...

回答 0 投票 0

基于嵌入的搜索

我正在尝试在文档中创建基于嵌入的搜索,其中包括标题、标题和内容。 这样我们就有了包含标题、标题和内容的数据框。 工作流程: 检索 k pa...

回答 1 投票 0

如何对文档动态派生属性的弹性查询结果进行评分

我有一个关于信息检索模式的问题。 我的搜索集群中有近 1000 万份这样的文档 { “id”:“7ftCdTQAAAAJ”, “作者”:[ ...

回答 0 投票 0

如何从linkedin搜索和获取用户和公司的数据?

我想构建一个可以从 linkedin 抓取信息的软件。就像 (seamless.ai) 如果用户搜索用户名或公司名称,该软件将显示该用户或 com 的详细信息......

回答 0 投票 0

R 中的函数/代码是 colnames() 的 class() 变体

我正在比较 R 中的多个数据框,每个数据框都有多个列,这些列应该具有相同的名称和相同的数据类型。我知道如何在检查匹配时简单地编码 TRUE/FALSE 结果

回答 1 投票 0

具有中等训练数据大小的简历解析最佳模型

目前我正在为突尼斯简历构建一个简历解析器,它将是英语和法语我开始研究我发现太多模型,现在我缩小了使用 SpaCy cust 的范围......

回答 0 投票 0

为 LTR 上传训练模型时出现 APACHE SOLR 错误

我训练了一个排名模型,但无法将 json 文件上传到 SOLR。 我收到以下错误: “msg”:“org.apache.solr.ltr.model.ModelException:...的输出矩阵

回答 0 投票 0

如何使用spaCy的基于规则的匹配来提取句子?

下午好,我正试图使用spacy来提取法语句子,从一个列表到另一个包含特定模式的句子。...

回答 1 投票 0

为什么添加非相关文档能提高系统性能?以及如何评估新的结果?

假设一个IR系统响应来自10,000个文档集合的查询,返回一个20个文档的排序列表。如果将5,000个非相关文档添加到集合中,我们发现 ...

回答 1 投票 -1


基于矩阵乘法检索文件。

我有一个模型,在多维向量空间中表示文档的集合。所以,例如,对于100k个文档,我的模型以300维向量的形式来表示它们。所以,...

回答 1 投票 0

计算余弦相似性

我想知道如何计算这两个向量的余弦相似性。A:(1,1,0,0,0,0,0,0,0,0) B:(1,0,0,1,0,0,0,1) 根据我的理解, 我需要将A乘以B然后除以... ...

回答 1 投票 0

无法连接到Docker中的Elasticsearch。

我无法在docker内连接到kubernetes中的elasticsearch。我的elasticsearch是通过kubernetes访问的,我有一个名为 "radius_ml_posts "的索引。我正在使用 elasticsearch 的 python ...

回答 1 投票 0

比较使用不同功能的两种算法

我有一组o规则,所有规则都从长文本中提取相同类型的实例(例如,城市名称)。我正在比较以下两种算法:Algorithm1:Algorithm2:知道...

回答 1 投票 0

生物医学名称实体识别的预先训练框架

是否存在经过培训的生物医学名称实体识别框架?谢谢和亲切的问候。

回答 1 投票 0

无法检索从控制器传递的值。 Laravel

我在将值从控制器传递到下一个控制器时遇到麻烦。我使用了以下代码:在BillController中:return redirect('pdf')-> with($ sid);在路线中:Route :: get('pdf','...

回答 1 投票 0

有人可以检查我的tf-idf加权是否正确吗?

我收集了15个文件,其中10个词中出现了吸烟,其中2个词中出现了健康。我需要在tf-idf加权之后检查这些项的值...

回答 1 投票 0

如何在Lucene QueryParser中指定两个字段?

我阅读了如何在QueryParser中合并多个字段?但是我不明白。目前,我有一个非常奇怪的结构,例如:parser = New QueryParser(“ bodytext”,Analyzer)parser2 = New ...

回答 2 投票 65

© www.soinside.com 2019 - 2024. All rights reserved.