data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

使用C＃和HTML Agility刮取网页

我已经读过HTML Agility 1.4是一个很好的解压缩网页的解决方案。作为一名新程序员，我希望我能对这个项目有所了解。我这样做是作为一个c＃申请表。 ......

c# .net web-scraping html-agility-pack data-mining

回答 3 投票 5

如何计算Weka中集群评估的准确性

我们如何使用Weka计算集群的准确性？我可以使用这个公式：准确度（A）=（tp + tn）/总＃样本，但我怎么知道什么是真阳性，假阳性，真阴性和......

machine-learning weka data-mining evaluation unsupervised-learning

回答 2 投票 0

使用RWeka和RStudio导入ARFF数据集（depencendy错误：rJava）

我目前正在使用R for Windows verison 3.5.3和RStudio 1.2.1335。我的目标是使用RWeka包导入ARFF数据集，以便进行一些关联分析，更具体地说，......

r rstudio data-mining apriori arff

回答 2 投票 -1

使用Pandas Dataframe的nGram频率

所以我在MongoDB中有一些名为title的字段（以及许多其他字段），但我们将专注于这一项。我想在整个时间内检索最常用的单词，例如，预期的结果将是......

python pandas data-mining

回答 1 投票 0

如何在R上运行基于文本的数据的聚类分析[关闭]

Excel数据将包含从用户收集的36个因素（基本上是或不是问题）。基于这个问题有没有办法进行聚类分析？我尝试使用iris示例作为参考，但是......

r cluster-analysis data-mining

回答 1 投票 -1

使用R - 可变长度差异误差的SVM分类

我目前正在使用R中可用的软件包帮助处理SVM分类问题。本网站提供的示例代码工作正常。 HTTP：//en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R / ...

r data-mining svm

回答 2 投票 1

分层聚类：确定最佳聚类数并统计描述聚类

我可以对R中的方法使用一些建议来确定最佳簇数，然后用不同的统计标准描述簇。我是R的新手，对...有基本的了解。

r data-mining cluster-analysis

回答 4 投票 12

线性回归和逻辑回归有什么区别？

当我们必须预测分类（或离散）结果的值时，我们使用逻辑回归。我相信我们使用线性回归来预测输入值给出的结果值。 ...

machine-learning data-mining linear-regression

回答 13 投票 185

如何计算BCubed精度和召回率

根据这个公布的页面BCubed精度和召回率，因此F1-Measure计算是评估聚类性能的最佳技术http://cs.utsa.edu/~qitian/seminar/Spring11 / ...

machine-learning cluster-analysis data-mining precision-recall

回答 1 投票 2

如何预处理高基数分类功能？

我有一个具有不同移动设备功能的数据文件。具有分类数据类型的一列具有1421种不同类型的值。我正在努力训练逻辑回归模型以及......

machine-learning data-mining logistic-regression

回答 3 投票 2

什么是期望最大化技术的直观解释？ [关闭]

期望最大化（EM）是一种对数据进行分类的概率方法。如果我错了，请纠正我，如果它不是分类器。这种EM技术的直观解释是什么？ ...

machine-learning cluster-analysis data-mining mathematical-optimization expectation-maximization

回答 8 投票 98

如何自动对字典中的单词进行分类？

我有一个很大的字典文件，dic.txt（实际上是SOWPODS），每行有一个英文单词。我想自动将此文件拆分为3个不同的文件easy_dic.txt（大多数...

language-agnostic data-mining classification

回答 3 投票 -1

如何在电子邮件中查找群集

我正在做一个机器学习项目，我有一个数据集，其中包含电子邮件中发生的单词的频率。我需要找到每个邮件所属的集群。我做的是......

python machine-learning scikit-learn cluster-analysis data-mining

回答 2 投票 0

什么是自然语言处理中的词性（POS）标签

我想通过斯坦福NLP包介绍。我试着在我的系统上执行一些例子。对于sentense：我喜欢它给出以下结果：有人可以告诉我什么是PRP，VBP？ ...

nlp data-mining stanford-nlp

回答 1 投票 -2

在不知道k的情况下，哪种聚类算法适用于一维列表？

我有一个像这个公共类的一维列表Zeit_und_Eigenschaft {[Feature] public double Sekunden {get;组; }} // ...列表 lzue =新名单

c# cluster-analysis data-mining k-means

回答 2 投票 2

数据收集过程的目标是什么？

我的主要问题是数据挖掘和机器学习领域。数据收集过程的目标是什么？任何帮助？

machine-learning data-mining

回答 2 投票 -1

稍后添加新功能时处理“缺失”数据

条件：我每天都有2个功能的数据集我收集新数据。所以行增加了我收集了1000天的数据，所以我有1000行我已经添加了新功能（功能3）...

data-mining

回答 1 投票 -1

package“fdapace”（R） - 如何访问功能主成分分析的主要组件

在数据集上使用“fdapace”包的FPCA（）函数后，该函数返回具有各种值和字段的FPCA对象。不幸的是我不知道这些领域包含哪些......

r functional-programming time-series data-mining pca

回答 1 投票 -2

如何使用机器学习算法进行洪水预报等事件预测？

我不习惯使用机器学习算法进行洪水预测。我目前的ML算法是决策树，我想预测洪水灾难或可能发生在......的事件。

machine-learning data-mining

回答 1 投票 -2

Scikit-learn：如何在一维数组上运行K Means？

我有一个介于0和1之间的13.876（13,876）值的数组。我想将sklearn.cluster.KMeans仅应用于此向量，以查找值被分组的不同群集。但是，它......

python scikit-learn data-mining k-means

回答 2 投票 15

data-mining 相关问题

最新问题