information-retrieval 相关问题

信息检索是一个研究领域，涉及从非结构化或半结构化数据集合中检索文档，信息或元数据。

Elasticsearch未显示任何匹配。 Python查询正确

第一篇文章。我知道之前已经有人问过这个问题，但是我根据以前的解决方案对代码进行了修改，但是仍然无法正常工作，并且该线程已关闭，因此我正在创建一个新线程。请忍受。...

python elasticsearch information-retrieval

回答 1 投票 0

如何计算短文本语料库的语义相似度？

两个短文本语料库之间无监督地比较语义相似性的正确方法是什么？比较两者的LDA主题分布似乎不是一个解决方案，就像简短的...

nlp information-retrieval corpus

回答 1 投票 0

将非结构化文本的组提取到以后的NLP中？

我是数据挖掘/文本挖掘的新手，所以我不确定我使用的是正确的术语。我试图提出一个提取相关内容组以稍后应用NLP和...

nlp data-mining text-mining information-retrieval information-extraction

回答 1 投票 0

使用k-gram索引的主题分类

我有一组主题，每个主题都有一个关键字列表。 {体育：['罗纳尔多·梅西·齐达内'，'足球棒球'，'巴塞罗那皇家'] ...}任务是对特定文件进行分类。 ...

python nlp data-mining information-retrieval

回答 1 投票 0

此功能未显示文件名……如何解决？

名称未从test_images中显示出来。在此路径中，有四个图像？？？如何解决此图像路径=“ C：/ Users / Saad / new Conuting obj / test_images /” import os import glob imagesList = ...

python image numpy directory information-retrieval

回答 1 投票 0

从纯文本中提取结构化数据的实用方法：寻找想法和反馈

我是一个本地乘车分享Facebook组的成员。该小组专门针对两个城市以及介于两者之间的所有事物，因此该职位（主要）是这样的：“我要从城市A开车到城市Z ...

nlp text-mining information-retrieval unsupervised-learning information-extraction

回答 1 投票 0

如何存储倒排索引？

我最近制作了一个约内存中有2,000,000个文档。这些文档是从mysql datbase导入的，加载大约需要6到10秒。每次启动程序时，都是...

python database data-structures information-retrieval inverted-index

回答 1 投票 0

使用（V1）python SDK API训练Watson Discovery无效

我想使用Watson Discovery V1 API进行相关性培训。我尝试了以下方法，但尚未获得理想的结果。下面详细描述该问题：我有一组文档，其中一些...

python machine-learning ibm-watson information-retrieval discovery

回答 1 投票 0

快速/优化python中的N-gram实现

哪个ngram实现在python中最快？我试图剖析nltk和scott的zip（http://locallyoptimal.com/blog/2013/01/20/elegant-n-gram-generation-in-python/）：从nltk.util导入...] >

python nlp nltk information-retrieval n-gram

回答 3 投票 11

在nlp中是否有用于事件跟踪的项目或成熟模型？

我刚刚开始使用nlp。最近，我有一个用于新闻事件提取和跟踪的项目。主要任务是提取事件（不限于ACE 2005格式）并在...

nlp stanford-nlp recurrent-neural-network information-retrieval information-extraction

回答 1 投票 0

JavaFX应用程序非常慢

我们在课程项目中建立了一个信息检索引擎。我们被要求使用JavaFX运行程序。问题在于该项目非常繁忙，其中包括：解析文档（460，...

user-interface javafx information-retrieval

回答 1 投票 0

使用JAVAFX的运行程序非常慢

我们在课程项目中构建了一个信息检索引擎。我们被要求使用JAVAFX运行我们的程序。问题是该项目非常繁忙，其中包括：解析文档（460,000 ...

user-interface javafx information-retrieval

回答 1 投票 0

快速文本预训练句子相似度

我想使用快速文本预训练模型来计算一组句子之间的相似度。谁能帮我？最好的方法是什么？我通过...

python nlp information-retrieval fasttext sentence-similarity

回答 1 投票 0

在WordCloud中将单词聚在一起

我正在使用wordcloud库在python中使用词云。例如，我想从以下列表中创建wordcloud：word_ls = ['北方的果园种植者'，'苹果的果园种植者'，...

python python-3.x data-visualization information-retrieval word-cloud

回答 1 投票 0

如何对某些术语进行额外加权的TF-IDF评分

我目前有一个tf-idf系统用于评分，并且我使用余弦相似度进行搜索。我想添加额外的权重，以考虑给定术语是否位于...

python search information-retrieval tf-idf cosine-similarity

回答 1 投票 0

根据许多文档计算文本相似度

我正在尝试针对其他搜索字词集合计算搜索字词A的文本相似度，例如“如何制作鸡”。为了计算相似度，我使用了余弦距离和TF-IDF来...

python information-retrieval cosine-similarity document-classification

回答 1 投票 0

可配置HTML信息提取

场景：我正在使用搜寻器提取一些HTML信息。现在，大多数提取规则都是硬编码的（不是标签或类似的东西，而是循环，嵌套元素等）。对于...

java web-crawler information-retrieval information-extraction

回答 1 投票 0

信息检索-如何处理将单个单词分解成多个标记的搜索查询

我只是信息检索的初学者。我正在寻求解决一个问题，即用户在输入单词时错误地在字符之间添加了一个空格，或者将两个单词合并为一个单词，从...

elasticsearch search lucene information-retrieval

回答 1 投票 0

如何清除Solr中的缓存？

我正在尝试比较不同Solr查询的性能。为了获得公平的测试，我想清除查询之间的缓存。怎么做？当然，可以重新启动服务器了，我当时是...

caching solr lucene information-retrieval

回答 3 投票 12

Solr _ version _字段作为查询最新结果的时间戳记

我们可以使用Solr _版本_字段作为时间戳/版本，以便我们可以查询特定_版本_ / timestamp中的最新文档吗？我的要求是定期（每天）检索新的...

solr information-retrieval solr-query-syntax

回答 1 投票 1

information-retrieval 相关问题

最新问题