information-retrieval 相关问题

信息检索是一个研究领域,涉及从非结构化或半结构化数据集合中检索文档,信息或元数据。

Elasticsearch未显示任何匹配。 Python查询正确

第一篇文章。我知道之前已经有人问过这个问题,但是我根据以前的解决方案对代码进行了修改,但是仍然无法正常工作,并且该线程已关闭,因此我正在创建一个新线程。请忍受。...

回答 1 投票 0

如何计算短文本语料库的语义相似度?

两个短文本语料库之间无监督地比较语义相似性的正确方法是什么?比较两者的LDA主题分布似乎不是一个解决方案,就像简短的...

回答 1 投票 0

将非结构化文本的组提取到以后的NLP中?

我是数据挖掘/文本挖掘的新手,所以我不确定我使用的是正确的术语。我试图提出一个提取相关内容组以稍后应用NLP和...

回答 1 投票 0

使用k-gram索引的主题分类

我有一组主题,每个主题都有一个关键字列表。 {体育:['罗纳尔多·梅西·齐达内','足球棒球','巴塞罗那皇家'] ...}任务是对特定文件进行分类。 ...

回答 1 投票 0

此功能未显示文件名……如何解决?

名称未从test_images中显示出来。在此路径中,有四个图像???如何解决此图像路径=“ C:/ Users / Saad / new Conuting obj / test_images /” import os import glob imagesList = ...

回答 1 投票 0

从纯文本中提取结构化数据的实用方法:寻找想法和反馈

我是一个本地乘车分享Facebook组的成员。该小组专门针对两个城市以及介于两者之间的所有事物,因此该职位(主要)是这样的:“我要从城市A开车到城市Z ...

回答 1 投票 0

如何存储倒排索引?

我最近制作了一个约内存中有2,000,000个文档。这些文档是从mysql datbase导入的,加载大约需要6到10秒。每次启动程序时,都是...

回答 1 投票 0

使用(V1)python SDK API训练Watson Discovery无效

我想使用Watson Discovery V1 API进行相关性培训。我尝试了以下方法,但尚未获得理想的结果。下面详细描述该问题:我有一组文档,其中一些...

回答 1 投票 0

快速/优化python中的N-gram实现

哪个ngram实现在python中最快?我试图剖析nltk和scott的zip(http://locallyoptimal.com/blog/2013/01/20/elegant-n-gram-generation-in-python/):从nltk.util导入...] >

回答 3 投票 11

在nlp中是否有用于事件跟踪的项目或成熟模型?

我刚刚开始使用nlp。最近,我有一个用于新闻事件提取和跟踪的项目。主要任务是提取事件(不限于ACE 2005格式)并在...

回答 1 投票 0

JavaFX应用程序非常慢

我们在课程项目中建立了一个信息检索引擎。我们被要求使用JavaFX运行程序。问题在于该项目非常繁忙,其中包括:解析文档(460,...

回答 1 投票 0

使用JAVAFX的运行程序非常慢

我们在课程项目中构建了一个信息检索引擎。我们被要求使用JAVAFX运行我们的程序。问题是该项目非常繁忙,其中包括:解析文档(460,000 ...

回答 1 投票 0

快速文本预训练句子相似度

我想使用快速文本预训练模型来计算一组句子之间的相似度。谁能帮我?最好的方法是什么?我通过...

回答 1 投票 0

在WordCloud中将单词聚在一起

我正在使用wordcloud库在python中使用词云。例如,我想从以下列表中创建wordcloud:word_ls = ['北方的果园种植者','苹果的果园种植者',...

回答 1 投票 0

如何对某些术语进行额外加权的TF-IDF评分

我目前有一个tf-idf系统用于评分,并且我使用余弦相似度进行搜索。我想添加额外的权重,以考虑给定术语是否位于...

回答 1 投票 0

根据许多文档计算文本相似度

我正在尝试针对其他搜索字词集合计算搜索字词A的文本相似度,例如“如何制作鸡”。为了计算相似度,我使用了余弦距离和TF-IDF来...

回答 1 投票 0

可配置HTML信息提取

场景:我正在使用搜寻器提取一些HTML信息。现在,大多数提取规则都是硬编码的(不是标签或类似的东西,而是循环,嵌套元素等)。对于...

回答 1 投票 0

信息检索-如何处理将单个单词分解成多个标记的搜索查询

我只是信息检索的初学者。我正在寻求解决一个问题,即用户在输入单词时错误地在字符之间添加了一个空格,或者将两个单词合并为一个单词,从...

回答 1 投票 0

如何清除Solr中的缓存?

我正在尝试比较不同Solr查询的性能。为了获得公平的测试,我想清除查询之间的缓存。怎么做?当然,可以重新启动服务器了,我当时是...

回答 3 投票 12

Solr _ version _字段作为查询最新结果的时间戳记

我们可以使用Solr _版本_字段作为时间戳/版本,以便我们可以查询特定_版本_ / timestamp中的最新文档吗?我的要求是定期(每天)检索新的...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.