cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

使用记分器实现 GridSearchCV 进行留一交叉验证

我正在尝试实现 scikit-learn 的 GridSearchCV 用于高斯过程回归(GPR)。我正在使用大约 200 个点的小数据集,并且想使用 LOOCV 作为我的

回答 1 投票 0

时间序列交叉验证警告(tidymodels、fit_resamples)

我正在尝试使用 tidymodels 来运行时间序列交叉验证,并且一直在遵循 Tidy Modeling with R 章节(https://www.tmwr.org/resampling#rolling)。 感谢任何帮助,谢谢...

回答 1 投票 0

使用 GroupKFold 实现交叉验证时出现关键错误

我有一个 df,有 3 个主要列“标签”、“嵌入”(特征)、“chr”。我正在尝试通过对染色体进行分组来进行 10 倍交叉验证,以使 chr1 行全部都在训练中......

回答 1 投票 0

K 折交叉验证后在完整数据集上预训练模型的实践

我最近为我的模型完成了 k 折交叉验证过程,其中我在每个训练集上预训练了模型,并在每个相应的验证集上对其进行了验证。这个过程帮助...

回答 1 投票 0

预测的 R 平方 - 什么时候它足够好?

为了了解我是否过度拟合多线性模型,我根据 https://tomhopper.me/2014/05/16/can-we-do-better-than- 计算了预测的 R^2 r 平方/ 我的问题是,当...

回答 1 投票 0

R cv.glmnet 错误与手动计算不符

模型报告的测量值与我计算的手动误差不符。我正在使用 R 包 glmnet 中的 cv.glmnet 函数。我相信当我将函数变量 keep 设置为 True 时,

回答 1 投票 0

使用 RFECV 和排列重要性的正确方法 - Sklearn

Sklearn #15075 中有一个实现这一点的提案,但与此同时,建议使用 eli5 作为解决方案。但是,我不确定我是否以正确的方式使用它。这是我的代码: 来自 sklearn.dat...

回答 2 投票 0

神经网络的交叉验证:如何对待epoch数?

我正在实现一个pytorch神经网络(回归),想要确定最好的网络拓扑、优化器等。我使用交叉验证,因为我有x个测量数据库,我想

回答 2 投票 0

如何在 TensorFlow 中实现大数据集的交叉验证而不将整个数据集加载到内存中?

我目前正在为一个机器学习项目处理一个大型数据集,并选择使用 TensorFlow 的 tf.data API 来高效管理数据加载和预处理,而无需加载 en...

回答 1 投票 0

为什么我在惩罚包的情况下得到了很大的最佳收缩参数 lambda 值?

我正在研究使用LASSO(最小绝对收缩和选择算子)和Cox模型的生存分析。我使用R包penalized和optL1函数来找到最佳收缩参数la...

回答 1 投票 0

减少因果影响模型中的可信区间

我正在构建的因果影响模型遇到了问题。 我正在尝试为一家商店的每日销售情况创建一个反事实(nseasons = 7)。我已包含附近其他 5 家商店的销售额。

回答 1 投票 0

不同指标的交叉验证

当我使用Python的Sklearn进行交叉验证并获取不同指标(准确度、精度等)的分数时,如下所示: result_accuracy = cross_val_score(分类器, X_train, y_train,

回答 1 投票 0

具有交叉验证的神经网络模型的多个指标

我正在尝试获得 LSTM 模型交叉验证的 F1、精度和召回率。 我知道如何显示准确性,但是当我尝试使用 cross_validate 显示其他指标时,我得到了许多不同的结果......

回答 1 投票 0

使用 GroupShuffleSplit 与 GridSearchCV 和 cross_val_score 进行嵌套交叉验证

我正在尝试执行嵌套交叉验证,同时还使用 GroupShuffleSplit 类合并基于组的拆分。但是,我遇到了“TypeError:无法 pickle 'generator'

回答 1 投票 0

K-Fold交叉验证的应用与部署

K-Fold 交叉验证是一种用于将数据拆分为 K 个折叠以进行测试和训练的技术。目标是估计机器学习模型的通用性。

回答 2 投票 0

使用 pytorch 进行 k 折交叉验证

我正在训练将 k 折交叉验证添加到我的脚本中,在阅读了一些文档后,它说训练循环应该位于折叠循环内 但我不明白的是...

回答 1 投票 0

克隆和拟合 RandomizedSearchCV 后的随机化行为

我有一个基本的嵌套 CV 循环,其中外部循环执行内部模型调整步骤。我的期望是每次折叠都应该抽取不同的超参数值随机样本。然而,在...

回答 1 投票 0

使用 cross_val_predict 与 cross_val_score 时,scikit-learn 分数不同

我希望这两种方法都会返回相当相似的错误,有人可以指出我的错误吗? 计算 RMSE... rf = RandomForestRegressor(random_state=555,n_estimators=100,max_深度=8)

回答 2 投票 0

目标转换和特征选择。 ValueError:输入 X 包含 NaN

我在 scikit-learn 中使用 RFECV 进行特征选择。我想使用 log(y) 运行 XGBoost 模型,因为我已经能够证明它的性能比仅 y 更好。 简单的...

回答 1 投票 0

跨多个模型的交叉验证折叠的一致性

我目前正在做一个机器学习项目,其中使用三种不同的模型:随机森林、AdaBoost 和梯度提升。对于每个模型,我将它们应用到一组

回答 1 投票 0

© www.soinside.com 2019 - 2025. All rights reserved.