data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

混淆矩阵和列联表之间有什么区别？

我正在编写一段代码来评估我的聚类算法，我发现每种评估方法都需要来自m * n矩阵的基本数据，如A = {aij}，其中aij是数据的数量......

matrix cluster-analysis data-mining difference

回答 2 投票 13

澄清需要关于min / sim哈希+ LSH

我对检测类似文件的技术有一个合理的理解，首先计算他们的minhash签名（来自他们的带状疱疹或n-gram），然后使用基于LSH的...

data-mining cluster-analysis locality-sensitive-hash minhash simhash

回答 1 投票 2

快速且可扩展的相似性检测

我有大的postgresql数据库，包含文件。每个文档表示为表中的一行。当新文档添加到数据库时，我需要检查重复项。但我不能只使用......

data-mining inverted-index minhash

回答 2 投票 1

如何在Word2Vec上执行群集

我有一个半结构化的数据集，每一行都属于一个用户：id，技能0，“java，python，sql”1，“java，python，spark，html”2，“业务管理，沟通”为什么半结构化是......

python nlp cluster-analysis data-mining word2vec

回答 1 投票 1

为什么在模型选择之前没有完成模型调整？

我在很多文章和书中都观察到模型选择是在模型调整之前完成的。模型选择通常使用某种形式的交叉验证，如k-fold，其中多个模型'...

machine-learning data-mining cross-validation model-comparison

回答 1 投票 1

scikit-learn DBSCAN内存使用情况

更新：最后，我选择用于聚类我的大型数据集的解决方案是Anony-Mousse在下面提出的解决方案。也就是说，使用ELKI的DBSCAN实现我的聚类而不是......

python scikit-learn cluster-analysis data-mining dbscan

回答 5 投票 19

对于与给定元组属于同一类的所有样本，通过属性均值处理python中的缺失值？

我有一个大型住房数据数据库，我需要通过同一个类填写缺失值。例如，在“卧室”列中，缺失的数据需要由平均值填充...

python data-mining

回答 1 投票 1

亚马逊推荐功能如何运作？

亚马逊推荐技术的屏幕背后有什么技术？我相信亚马逊的推荐目前是市场上最好的，但他们如何为我们提供这样的相关...

algorithm language-agnostic data-mining

回答 8 投票 141

聚类算法的性能分析

我已经获得了2个数据集，并希望使用KNIME对集合进行聚类分析。一旦我完成了聚类，我希望进行2种不同的性能比较......

machine-learning data-mining cluster-analysis knime

回答 4 投票 1

如何根据pandas中的时差为用户设置会话

我有一个具有这种结构的数据帧（按user_id排序，事件的时间）：user_id事件的时间（以毫秒为单位）每个user_id的前一个事件和当前事件之间的时间差（在......中）

python pandas jupyter-notebook analytics data-mining

回答 1 投票 1

比较R与Matlab进行数据挖掘

我最近开始学习R，而不是开始用Matlab编写代码，主要是因为它是开源的。我目前在数据挖掘和机器学习领域工作。我发现很多机器学习......

r matlab machine-learning data-mining language-comparisons

回答 8 投票 35

Apriori算法实现

我正在使用apiori算法实现从事务集生成关联规则，我得到以下关联规则。但我得到一个关联规则1-> 8我可以假设8 - > ...

artificial-intelligence associations data-mining apriori

回答 3 投票 1

IP地址直方图（熊猫系列）[重复]

我希望绘制一个直方图来检查用于数据挖掘的IP地址的出现频率。我的片段： - 导入pandas为pd import matplotlib.pyplot为plt p1 = r'small_set.csv'd = pd ....

python pandas ip-address data-mining valueerror

回答 1 投票 0

什么是更好的Orange.data.Table或Pandas在python中进行数据管理？

我正在进行数据挖掘，我不知道是否要使用Table或Pandas？用于选择最适合管理我的数据集的库的任何信息都将受到欢迎。感谢任何有帮助的答案......

pandas data-mining libraries orange

回答 1 投票 -1

数据分析与数据科学与数据挖掘与数据分析

我遇到过这些术语的多个定义，无法得到究竟是什么的实际含义。来自有经验的人，究竟是什么数据分析，数据科学，数据......

data-mining data-analysis

回答 2 投票 0

何时使用k意味着聚类算法？

我可以将k-means算法用于单个属性吗？属性和集群数量之间是否存在任何关系？我有一个属性的性能，我想对数据进行分类......

cluster-analysis data-mining k-means

回答 5 投票 2

什么是分层自举？

我学会了训练和分层。但什么是分层引导？它是如何工作的？假设我们有一个n个实例（观察）的数据集，m是类的数量。怎么样 ...

algorithm machine-learning data-mining

回答 1 投票 6

混淆矩阵图形不显示数据

我正在使用完整数据集的一些分类器进行逻辑回归。它工作正常，我得到了一个很好的混淆矩阵，但我无法让情节工作。我正在使用Python 3.6 ...

python-3.x dataframe data-mining logistic-regression

回答 2 投票 0

Python实现的OPTICS（聚类）算法

我正在寻找在Python中使用OPTICS算法的一个不错的实现。我将用它来形成基于密度的点（（x，y）对）。我正在寻找接受（x，y）对的东西......

python machine-learning cluster-analysis data-mining optics-algorithm

回答 7 投票 32

计算单词列表之间的相似度

我想计算两个单词列表之间的相似度，例如：['email'，'user'，'this'，'email'，'address'，'customer']与此列表类似：['email' ，'邮件'，'地址'，'netmail']我......

python data-mining text-mining similarity

回答 2 投票 -1

data-mining 相关问题

最新问题