数据挖掘是分析大量数据以查找模式和共性的过程。
我已经读过HTML Agility 1.4是一个很好的解压缩网页的解决方案。作为一名新程序员,我希望我能对这个项目有所了解。我这样做是作为一个c#申请表。 ......
我们如何使用Weka计算集群的准确性?我可以使用这个公式:准确度(A)=(tp + tn)/总#样本,但我怎么知道什么是真阳性,假阳性,真阴性和......
使用RWeka和RStudio导入ARFF数据集(depencendy错误:rJava)
我目前正在使用R for Windows verison 3.5.3和RStudio 1.2.1335。我的目标是使用RWeka包导入ARFF数据集,以便进行一些关联分析,更具体地说,......
所以我在MongoDB中有一些名为title的字段(以及许多其他字段),但我们将专注于这一项。我想在整个时间内检索最常用的单词,例如,预期的结果将是......
Excel数据将包含从用户收集的36个因素(基本上是或不是问题)。基于这个问题有没有办法进行聚类分析?我尝试使用iris示例作为参考,但是......
我目前正在使用R中可用的软件包帮助处理SVM分类问题。本网站提供的示例代码工作正常。 HTTP://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R / ...
我可以对R中的方法使用一些建议来确定最佳簇数,然后用不同的统计标准描述簇。我是R的新手,对...有基本的了解。
当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归。我相信我们使用线性回归来预测输入值给出的结果值。 ...
根据这个公布的页面BCubed精度和召回率,因此F1-Measure计算是评估聚类性能的最佳技术http://cs.utsa.edu/~qitian/seminar/Spring11 / ...
我有一个具有不同移动设备功能的数据文件。具有分类数据类型的一列具有1421种不同类型的值。我正在努力训练逻辑回归模型以及......
期望最大化(EM)是一种对数据进行分类的概率方法。如果我错了,请纠正我,如果它不是分类器。这种EM技术的直观解释是什么? ...
我有一个很大的字典文件,dic.txt(实际上是SOWPODS),每行有一个英文单词。我想自动将此文件拆分为3个不同的文件easy_dic.txt(大多数...
我正在做一个机器学习项目,我有一个数据集,其中包含电子邮件中发生的单词的频率。我需要找到每个邮件所属的集群。我做的是......
我想通过斯坦福NLP包介绍。我试着在我的系统上执行一些例子。对于sentense:我喜欢它给出以下结果:有人可以告诉我什么是PRP,VBP? ...
我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单
条件:我每天都有2个功能的数据集我收集新数据。所以行增加了我收集了1000天的数据,所以我有1000行我已经添加了新功能(功能3)...
package“fdapace”(R) - 如何访问功能主成分分析的主要组件
在数据集上使用“fdapace”包的FPCA()函数后,该函数返回具有各种值和字段的FPCA对象。不幸的是我不知道这些领域包含哪些......
我不习惯使用机器学习算法进行洪水预测。我目前的ML算法是决策树,我想预测洪水灾难或可能发生在......的事件。
Scikit-learn:如何在一维数组上运行K Means?
我有一个介于0和1之间的13.876(13,876)值的数组。我想将sklearn.cluster.KMeans仅应用于此向量,以查找值被分组的不同群集。但是,它......