data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

使用C#和HTML Agility刮取网页

我已经读过HTML Agility 1.4是一个很好的解压缩网页的解决方案。作为一名新程序员,我希望我能对这个项目有所了解。我这样做是作为一个c#申请表。 ......

回答 3 投票 5

如何计算Weka中集群评估的准确性

我们如何使用Weka计算集群的准确性?我可以使用这个公式:准确度(A)=(tp + tn)/总#样本,但我怎么知道什么是真阳性,假阳性,真阴性和......

回答 2 投票 0

使用RWeka和RStudio导入ARFF数据集(depencendy错误:rJava)

我目前正在使用R for Windows verison 3.5.3和RStudio 1.2.1335。我的目标是使用RWeka包导入ARFF数据集,以便进行一些关联分析,更具体地说,......

回答 2 投票 -1

使用Pandas Dataframe的nGram频率

所以我在MongoDB中有一些名为title的字段(以及许多其他字段),但我们将专注于这一项。我想在整个时间内检索最常用的单词,例如,预期的结果将是......

回答 1 投票 0

如何在R上运行基于文本的数据的聚类分析[关闭]

Excel数据将包含从用户收集的36个因素(基本上是或不是问题)。基于这个问题有没有办法进行聚类分析?我尝试使用iris示例作为参考,但是......

回答 1 投票 -1

使用R - 可变长度差异误差的SVM分类

我目前正在使用R中可用的软件包帮助处理SVM分类问题。本网站提供的示例代码工作正常。 HTTP://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R / ...

回答 2 投票 1

分层聚类:确定最佳聚类数并统计描述聚类

我可以对R中的方法使用一些建议来确定最佳簇数,然后用不同的统计标准描述簇。我是R的新手,对...有基本的了解。

回答 4 投票 12

线性回归和逻辑回归有什么区别?

当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归。我相信我们使用线性回归来预测输入值给出的结果值。 ...

回答 13 投票 185

如何计算BCubed精度和召回率

根据这个公布的页面BCubed精度和召回率,因此F1-Measure计算是评估聚类性能的最佳技术http://cs.utsa.edu/~qitian/seminar/Spring11 / ...

回答 1 投票 2

如何预处理高基数分类功能?

我有一个具有不同移动设备功能的数据文件。具有分类数据类型的一列具有1421种不同类型的值。我正在努力训练逻辑回归模型以及......

回答 3 投票 2

什么是期望最大化技术的直观解释? [关闭]

期望最大化(EM)是一种对数据进行分类的概率方法。如果我错了,请纠正我,如果它不是分类器。这种EM技术的直观解释是什么? ...

回答 8 投票 98

如何自动对字典中的单词进行分类?

我有一个很大的字典文件,dic.txt(实际上是SOWPODS),每行有一个英文单词。我想自动将此文件拆分为3个不同的文件easy_dic.txt(大多数...

回答 3 投票 -1

如何在电子邮件中查找群集

我正在做一个机器学习项目,我有一个数据集,其中包含电子邮件中发生的单词的频率。我需要找到每个邮件所属的集群。我做的是......

回答 2 投票 0

什么是自然语言处理中的词性(POS)标签

我想通过斯坦福NLP包介绍。我试着在我的系统上执行一些例子。对于sentense:我喜欢它给出以下结果:有人可以告诉我什么是PRP,VBP? ...

回答 1 投票 -2

在不知道k的情况下,哪种聚类算法适用于一维列表?

我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单

回答 2 投票 2

数据收集过程的目标是什么?

我的主要问题是数据挖掘和机器学习领域。数据收集过程的目标是什么?任何帮助?

回答 2 投票 -1

稍后添加新功能时处理“缺失”数据

条件:我每天都有2个功能的数据集我收集新数据。所以行增加了我收集了1000天的数据,所以我有1000行我已经添加了新功能(功能3)...

回答 1 投票 -1

package“fdapace”(R) - 如何访问功能主成分分析的主要组件

在数据集上使用“fdapace”包的FPCA()函数后,该函数返回具有各种值和字段的FPCA对象。不幸的是我不知道这些领域包含哪些......

回答 1 投票 -2

如何使用机器学习算法进行洪水预报等事件预测?

我不习惯使用机器学习算法进行洪水预测。我目前的ML算法是决策树,我想预测洪水灾难或可能发生在......的事件。

回答 1 投票 -2

Scikit-learn:如何在一维数组上运行K Means?

我有一个介于0和1之间的13.876(13,876)值的数组。我想将sklearn.cluster.KMeans仅应用于此向量,以查找值被分组的不同群集。但是,它......

回答 2 投票 15

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.