cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

为什么tsCV适合用于模型选择算法,如etsauto.arima?

在Rob Hyndman的书中,Rob描述了使用tsCV来评估auto.arima和ets返回的模型的预测精度。这更多的是一个概念性的问题,但是我研究了一下底层的 ...

回答 1 投票 1

在sklearn cross_val_predict中,如何确保来自特定组的所有样本在traintest中都是togehter?

我有一个数据框,其中每个样本属于一个组。For exampe: df = a b c group 1 1 2 G1 1 6 1 G1 8 2 8 G3 2 8 7 G2 1 9 2 G2 1 0 2 G3 I want to run ...

回答 1 投票 0

在数据不平衡的管道中进行交叉验证的正确方法。

对于给定的不平衡数据,我已经创建了一个不同的管道,用于标准化&一个热编码 numeric_transformer = Pipeline(st steps = [('scaler', StandardScaler())])...。

回答 1 投票 1

在sklearn cross_val_predict中,如何确保来自特定组的所有样本在traintest中都是togehter?

我有一个数据框,其中每个样本属于一个组。例如:df = a b c group 1 1 2 G1 1 6 1 G1 8 2 8 G3 2 8 7 G2 1 9 2 G2 1 0 2 G3 我想运行... ...

回答 1 投票 0

Caret训练函数中的PCA预处理参数。

我正在对我的数据进行knn回归,想:a)通过repredcv进行交叉验证,找到一个最优的k;b)在建立knn模型时,在90%水平阈值下使用PCA来减少 ...

回答 1 投票 4

如何在sklearn中为GaussianNB和KNeighborsRegressor使用类权重?

我有一个高度不平衡的数据集,我想从中获得分类(二进制)和概率。我设法使用逻辑回归以及随机森林来获取结果...

回答 1 投票 1

交叉验证是否用于模型选择?

所以这开始让我有些困惑。例如,具有训练GLM模型的以下代码:glm_sens = train(form = target〜。,data = ABT,trControl = trainControl(method =“ ...

回答 1 投票 0

来自R中给定csv文档术语矩阵的lda主题建模交叉验证

我正在尝试进行交叉验证分析,以选择要估计的“适当”主题数。但是,我的数据已被编码在三列(相当大)的表中。这是一个示例:...

回答 1 投票 0

如何在插入符号或整形模型中使用LASSO进行嵌套交叉验证?

目标,我想实施LASSO模型,并根据此处显示的示意图在训练集上检查其可行性。 (示意图:将所有数据分为测试集和训练集。...

回答 1 投票 1

我如何在LightFM电影推荐系统的用户项交互矩阵上进行交叉验证?

我有一个来自movielens数据集的交互矩阵(scipy.sparse.csr_matrix),具有来自用户的电影评分,并且我正在建立一个具有item_features的LightFM模型。现在,我将矩阵除以...

回答 1 投票 0

在数据不平衡的管道中进行交叉验证的正确方法

对于给定的不平衡数据,我为标准化创建了不同的管道,并进行了一种热编码的numeric_transformer = Pipeline(steps = [('scaler',StandardScaler())])...

回答 1 投票 2

从cva.glmnet对象中提取最佳参数

我确信运行cva.glmnet后,有一种优雅的方法可以提取最佳的alpha和lambda,但是我无法找到它。这是我同时使用的代码。谢谢图书馆(数据。...

回答 1 投票 5

用于逻辑回归的交叉验证和套索正则化错误

我想用套索正则化创建一个5倍CV Logistic回归模型,但是我得到了这样的错误消息:缺少所有RMSE指标值:。我从物流开始...

回答 1 投票 0

千进一出交叉验证和混淆矩阵

我必须使用k个最近的邻居对虹膜数据进行分类,(k = 1:30)我已将数据分为样本和涉及“留一法”交叉验证的训练,因此我具有以下脚本:load ...

回答 2 投票 1

如何报告四阶多项式回归模型

我正在为我的班级做一个线性回归项目。我的模型有三个自变量(y〜x1 + x2 + x3)。该模型拟合得很好,我的R平方值为0.94。但是K折交叉验证...

回答 1 投票 0

RankLib中的k倍交叉验证

我想对MQ2008数据集进行5折交叉验证。我正在使用RankLib在数据集上应用ML算法。我对Ranklib中提供的用于交叉验证的kcv选项感到困惑。使用的命令:...

回答 1 投票 0

使用pROC从现有数据中绘制ROC曲线

我已经创建了一个分类器,并对该模型进行了3次交叉验证,并使用几个随机种子进行了重新生成。我以0.1的间隔使用阈值,并且已经计算出...

回答 1 投票 3

k交叉验证中的x和y在测试模型时具有不同的行数

[使用来自泰坦尼克号的火车和测试数据集,我试图根据他们的性别来预测乘客是否在泰坦尼克号上胜过。我想建立一个分类,然后测试和评估...

回答 2 投票 0

如何从k折交叉验证中的每一折中学习?

这里有些东西让我感到困惑。执行k折交叉验证时。对于每一折,我们都有不同的验证集和稍有变化的学习集。假设您从第一个...进步了。

回答 1 投票 0

roc_auc_score,'roc_auc','auc'的奇怪行为

虽然为xgboost优化参数,但roc_auc_score指标遇到问题。与训练中的结果相比,在交叉验证过程中我得到的结果明显不同...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.