data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

混淆矩阵和列联表之间有什么区别?

我正在编写一段代码来评估我的聚类算法,我发现每种评估方法都需要来自m * n矩阵的基本数据,如A = {aij},其中aij是数据的数量......

回答 2 投票 13

澄清需要关于min / sim哈希+ LSH

我对检测类似文件的技术有一个合理的理解,首先计算他们的minhash签名(来自他们的带状疱疹或n-gram),然后使用基于LSH的...

回答 1 投票 2

快速且可扩展的相似性检测

我有大的postgresql数据库,包含文件。每个文档表示为表中的一行。当新文档添加到数据库时,我需要检查重复项。但我不能只使用......

回答 2 投票 1

如何在Word2Vec上执行群集

我有一个半结构化的数据集,每一行都属于一个用户:id,技能0,“java,python,sql”1,“java,python,spark,html”2,“业务管理,沟通”为什么半结构化是......

回答 1 投票 1

为什么在模型选择之前没有完成模型调整?

我在很多文章和书中都观察到模型选择是在模型调整之前完成的。模型选择通常使用某种形式的交叉验证,如k-fold,其中多个模型'...

回答 1 投票 1

scikit-learn DBSCAN内存使用情况

更新:最后,我选择用于聚类我的大型数据集的解决方案是Anony-Mousse在下面提出的解决方案。也就是说,使用ELKI的DBSCAN实现我的聚类而不是......

回答 5 投票 19

对于与给定元组属于同一类的所有样本,通过属性均值处理python中的缺失值?

我有一个大型住房数据数据库,我需要通过同一个类填写缺失值。例如,在“卧室”列中,缺失的数据需要由平均值填充...

回答 1 投票 1

亚马逊推荐功能如何运作?

亚马逊推荐技术的屏幕背后有什么技术?我相信亚马逊的推荐目前是市场上最好的,但他们如何为我们提供这样的相关...

回答 8 投票 141

聚类算法的性能分析

我已经获得了2个数据集,并希望使用KNIME对集合进行聚类分析。一旦我完成了聚类,我希望进行2种不同的性能比较......

回答 4 投票 1

如何根据pandas中的时差为用户设置会话

我有一个具有这种结构的数据帧(按user_id排序,事件的时间):user_id事件的时间(以毫秒为单位)每个user_id的前一个事件和当前事件之间的时间差(在......中)

回答 1 投票 1

比较R与Matlab进行数据挖掘

我最近开始学习R,而不是开始用Matlab编写代码,主要是因为它是开源的。我目前在数据挖掘和机器学习领域工作。我发现很多机器学习......

回答 8 投票 35

Apriori算法实现

我正在使用apiori算法实现从事务集生成关联规则,我得到以下关联规则。但我得到一个关联规则1-> 8我可以假设8 - > ...

回答 3 投票 1

IP地址直方图(熊猫系列)[重复]

我希望绘制一个直方图来检查用于数据挖掘的IP地址的出现频率。我的片段: - 导入pandas为pd import matplotlib.pyplot为plt p1 = r'small_set.csv'd = pd ....

回答 1 投票 0

什么是更好的Orange.data.Table或Pandas在python中进行数据管理?

我正在进行数据挖掘,我不知道是否要使用Table或Pandas?用于选择最适合管理我的数据集的库的任何信息都将受到欢迎。感谢任何有帮助的答案......

回答 1 投票 -1

数据分析与数据科学与数据挖掘与数据分析

我遇到过这些术语的多个定义,无法得到究竟是什么的实际含义。来自有经验的人,究竟是什么数据分析,数据科学,数据......

回答 2 投票 0

何时使用k意味着聚类算法?

我可以将k-means算法用于单个属性吗?属性和集群数量之间是否存在任何关系?我有一个属性的性能,我想对数据进行分类......

回答 5 投票 2

什么是分层自举?

我学会了训练和分层。但什么是分层引导?它是如何工作的?假设我们有一个n个实例(观察)的数据集,m是类的数量。怎么样 ...

回答 1 投票 6

混淆矩阵图形不显示数据

我正在使用完整数据集的一些分类器进行逻辑回归。它工作正常,我得到了一个很好的混淆矩阵,但我无法让情节工作。我正在使用Python 3.6 ...

回答 2 投票 0

Python实现的OPTICS(聚类)算法

我正在寻找在Python中使用OPTICS算法的一个不错的实现。我将用它来形成基于密度的点((x,y)对)。我正在寻找接受(x,y)对的东西......

回答 7 投票 32

计算单词列表之间的相似度

我想计算两个单词列表之间的相似度,例如:['email','user','this','email','address','customer']与此列表类似:['email' ,'邮件','地址','netmail']我......

回答 2 投票 -1

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.