数据挖掘是分析大量数据以查找模式和共性的过程。
根据我的理解,我认为PCA只能用于连续功能。但是,虽然尝试理解onehot编码和标签编码之间的区别来自...
是什么让k-medoid中的距离测量“比k-means更好”?
我正在阅读k-means聚类和k-medoid聚类之间的区别。据推测,在k-medoid算法中使用成对距离测量是有利的,而不是......
我有一个pandas DataFrame,它保存一些对象的数据,其中包括对象的某些部分(Left,Top,Right,Bottom)的位置。例如:ObjectID Left,Right,Top,Bottom 1 ......
我想创建自己的简单推荐系统,关于书籍。但是存在一些问题 - 一个人组织算法训练数据集是不可能的(至少非常困难)。所以......
有人能解释数据挖掘中分类和聚类之间的区别吗?如果可以,请举两个例子来理解主要想法。
我目前的研究目的是探索机器学习方法,以选择与治疗高度相关的结果,这将被视为处理多种测试的方法。我......
我是LDA的新生,我想在我的工作中使用它。但是,出现了一些问题。为了获得最佳性能,我想估算最佳主题编号。看完“发现......
我有arff文件需要转换为矩阵。我已经将文件转换为数组但无法将其转换为矩阵。有人可以帮忙吗下面我有用于将数据转换为...的代码
嗨,我一直在学习数据挖掘,并遇到了这个问题。我似乎无法弄清楚自己。所以我们有一个无向图(没有属性)G =(V,E)并想要检测那些......
我正在使用周期图绘制捕捉时间序列的季节性,我想使用前十个频率成分来创建季节性时间序列,到目前为止,我绘制了周期图:...
请注意:此问题的标题可能不明确,因此我请其他用户请编辑它。我无法找到适合这个问题的合适标题。讨论的问题......
我应该使用什么分类器根据他购买的月份找出每个用户的预期后续购买类别?
我应该使用机器学习中的哪个分类器根据他购买的月份预测后续购买的预期类别?给定由列uuid日期价格组成的数据集...
可以使用sklearn.dbscan或sklearn.kmeans超过2维吗?
在我最近的项目中,有人试图用sklearn.dbscan聚类多维数据集。但我对这种方法非常怀疑。我们怎么知道eps和min_samples?我的意思是......
我有一个bin,我的标签应该是'points',但是当我生成混淆矩阵时,它会生成一个称为a和b的标签作为标签,但它不会将标签显示为90以上的点和点......
我对主题建模领域感兴趣,我即将开发自己的算法。我目前面临的问题是如何将我的工作成果与状态结果进行比较。
我目前正在R中构建应用程序来计算QR矩阵分解,QR非负矩阵分解和计算ICA。目前我正在完成第一项任务。我是 ...
这是一个愚蠢的问题,但基本上我使用k-means将我的数据分成不同的集群,这是一个类项目顺便说一句。我有一切工作,但我必须写我的集群......
Naive Bayesian使用“Bag of Words”方法进行主题检测
我正在尝试实现一种天真的贝叶斯方法来查找给定文档或单词流的主题。是否有朴素贝叶斯方法,我可以找到这个?还有,我......
我很好奇是否可以使用LSH找到完全匹配。在MIT网站上关于LSH他们说:Locality-Sensitive Hashing(LSH)是一种用于求解近似或精确近邻的算法......
如何在python中的sklearn中获取GridSearchCV中的选定功能
我使用交叉验证(rfecv)作为GridSearchCV的特征选择技术使用recurive特征消除。我的代码如下。 X = df [my_features_all] y = df ['gold_standard'] ......