cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

将数据集在训练和测试之间进行划分,尊重类分布[重复]。

我想在一个给定的数据集中对一个机器学习算法进行10次运行,分布如下 np.unique(x[:,24], return_counts=True) (array([1., 2.]), array([700, 300])) 这意味着......

回答 2 投票 -1

在Python中应该如何使用cross_val_score()?

我在比较Perceptron的单次运行的准确率 和使用Perceptron作为分类器的虹膜数据集的cross_val_score()的准确率。我对这个问题不确定。在一个...

回答 1 投票 0

不知道get_n_splits的目的是什么,为什么要这样做。

我在Kaggle上关注一个内核,看到了这段代码。#验证函数 n_folds = 5 def rmsle_cv(model): kf = KFold(n_folds, shuffle=True, random_state=42).get_n_splits(train.values) ... ...

回答 1 投票 0

如何从Gridsearchcv中绘制决策树?

我试图绘制用GridSearchCV形成的决策树,但它给我一个Attribute错误。AttributeError: 'GridSearchCV' object has no attribute 'n_features_' However if i try ...

回答 1 投票 0

H2O交叉验证选择的nfolds会改变数据的使用比例吗?

H2O手册中介绍了k折交叉验证的数据是如何拆分的。给出的例子是针对5折交叉验证的,请看这里:http:/docs.h2o.aih2olatest-stableh2o-docsdata-science...

回答 1 投票 0

| param["p1"] > 1) { ...

我首先想到的是某个地方出现了愚蠢的拼写错误,但似乎并非如此。感谢任何帮助。

回答 1 投票 0

sklearn中不同分类器的cross_val_score表现不同

我在使用sklearn中的cross_val_score()时遇到了一些困难,我用下面的代码实例化了一个KNeighborsClassifier:clf = KNeighborsClassifier(n_neighbors=28)。我用下面的代码实例化了一个KNeighborsClassifier:clf = KNeighborsClassifier(n_neighbors=28) 然后我使用cross ...

回答 1 投票 0

如何计算每个分类器的k倍交叉验证和性能的标准差?

我需要(根据提示)"计算3个算法中每个算法的n倍交叉验证以及n倍性能测量的平均值和标准差"。我的原始数据框是...

回答 1 投票 1

K-fold交叉验证和样本外交叉验证。

K-fold交叉验证和样本外交叉验证的区别是什么?你能用几句话来描述每种CV方法的步骤吗?

回答 1 投票 0

计算交叉验证的AUC 95 % CI (Python, sklearn)

我正在寻找正确的方法来计算AUC 95%的CI从我的5倍的CV。n = 81我的训练数据集,所以,如果我应用5倍的CV,相当于平均约。

回答 1 投票 0

使用RepeatedStratifiedKFold 5*10从cross_val_predict得到的概率。

我的目标是计算5*10 StratifiedKfold CV的AUC、特异性、灵敏度和95% CI。我还需要阈值为0.4的特异性和灵敏度,以使灵敏度最大化。...

回答 1 投票 0

使用手动KFold-交叉验证与KerasClassifier-KFold交叉验证时的不同结果

我一直在努力理解为什么两个类似的 Kfold 交叉验证会产生两个不同的平均值。当我使用手动KFold方法时(使用Tensorflow和Keras),cvscores = [] kfold = ...

回答 1 投票 0

在文本分类的任务中,如何编写管道的特征提取器类?

我在做一个文本作者归属模型。分类器是SVM(线性核),我想使用sklearn.model_selection中的cross_val_score进行评估。问题是如何反馈到 ...

回答 1 投票 0

scikit-learn交叉验证,负值与均值平方误差。

当我使用下面的代码,大小为(952,144)的数据矩阵X和大小为(952)的输出向量y时,mean_squared_error度量返回负值,这是意想不到的。你有什么办法吗?...

回答 2 投票 47

在Sklearn的自定义估计器上打印交叉验证语句

根据文档,我在sklearn中建立了一个自定义估计器。在fit方法里面,我有一个print语句,我用来调试。当我创建这个模型的实例并调用 ...

回答 1 投票 1

有没有办法在 sci-kit 学习交叉验证中定义我想要的每个标签的分数?

我写了一个简单的Python脚本,使用sklearn.neural_network.MLPClassifier和sklearn.model_selection.GridSearchCV对二进制分类数据进行预测,每个点都 ...

回答 1 投票 0

如何在使用SVM的同时计算分数?

我是机器学习的新手,我对sklearn的文档有点困惑,如何在使用sklearn.svm.SVC时获得分数。这是我的代码x_train,x_test,y_train,y_test=...

回答 1 投票 0

循环cv.glmnet并得到 "最佳 "系数。

正如在cv.glmnet的帮助中提到的,"cv.glmnet的结果是随机的,因为折线是随机选择的。用户可以通过多次运行cv.glmnet来减少这种随机性,并取平均值。

回答 1 投票 1

在神经网络和caret(R)中设置隐藏层和神经元。

我想用包里的neuralnet和caret对一个神经网络进行交叉验证。数据df可以从这个帖子中复制。运行neuralnet()函数时,有一个参数叫 ...

回答 1 投票 0

当使用cross_val_predict与cross_val_score时,sklearn的cv分数是不同的。

我以为这两种方法都会返回比较相似的错误,请问谁能给我指出错误的地方?计算RMSE... rf = RandomForestRegressor(random_state=555, n_estimators=100, max_depth=8) ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.