cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

使用cross_val_score时如何每次打乱数据?

训练 Ridge 分类器时,我能够执行 10 折交叉验证,如下所示: clf = Linear_model.RidgeClassifier() n_folds = 10 分数 = cross_val_score(clf, X_train, y_train, cv=n_folds)

回答 1 投票 0

Python:GridSearchCV 花费太长时间才能完成运行

我正在尝试进行网格搜索来优化我的模型,但执行时间太长。我的总数据集只有大约 15,000 个观察值,大约有 30-40 个变量。我成功...

回答 3 投票 0

Scikit-learn 上的嵌套交叉验证示例

我正在尝试研究 Sklearn 中嵌套 CV 与非嵌套 CV 的示例。我检查了多个答案,但我仍然对这个例子感到困惑。 据我所知,嵌套简历旨在使用

回答 1 投票 0

为什么我在插入符中的“lm”中使用不同的交叉验证规范会得到相同的结果

我正在使用插入符包来使用相同的数据拟合不同的模型。我对所有这些都使用交叉验证;然而,当我使用 lm 方法使用不同数量的折叠时,我得到...

回答 1 投票 0

如何使用sklearns的cross_validate对样本进行加权仅用于评分?

我正在对由真实样本和增强样本组成的数据集运行回归任务。增强样本是通过抖动真实样本生成的。我想选择...

回答 1 投票 0

使用 statsmodel 估计和 scikit-learn 交叉验证,可能吗?

我正在寻找一种方法,可以使用从python statsmodel获得的拟合对象(结果)来输入scikit-learn cross_validation方法的cross_val_score? 所附链接表明它可能...

回答 4 投票 0

如何在matlab中将数据非随机地分割成k折?

我有一个数据集,为简单起见,我们假设它有 1000 个样本(每个样本都是一个向量)。 我想分割我的数据以进行交叉验证、训练和测试,而不是随机1,所以例如,如果我想要 4 倍 c...

回答 4 投票 0

ValueError:无法将字符串转换为浮点数:'Curtis RIngraham Directge'

我正在进行数据分割和交叉验证。 对于数据分割,我需要仅提取测试数据集,并保留其余数据以进行交叉验证。我越来越...

回答 1 投票 0

使用记分器实现 GridSearchCV 进行留一交叉验证

我正在尝试实现 scikit-learn 的 GridSearchCV 用于高斯过程回归(GPR)。我正在使用大约 200 个点的小数据集,并且想使用 LOOCV 作为我的

回答 1 投票 0

时间序列交叉验证警告(tidymodels、fit_resamples)

我正在尝试使用 tidymodels 来运行时间序列交叉验证,并且一直在遵循 Tidy Modeling with R 章节(https://www.tmwr.org/resampling#rolling)。 感谢任何帮助,谢谢...

回答 1 投票 0

使用 GroupKFold 实现交叉验证时出现关键错误

我有一个 df,有 3 个主要列“标签”、“嵌入”(特征)、“chr”。我正在尝试通过对染色体进行分组来进行 10 倍交叉验证,以使 chr1 行全部都在训练中......

回答 1 投票 0

K 折交叉验证后在完整数据集上预训练模型的实践

我最近为我的模型完成了 k 折交叉验证过程,其中我在每个训练集上预训练了模型,并在每个相应的验证集上对其进行了验证。这个过程帮助...

回答 1 投票 0

预测的 R 平方 - 什么时候它足够好?

为了了解我是否过度拟合多线性模型,我根据 https://tomhopper.me/2014/05/16/can-we-do-better-than- 计算了预测的 R^2 r 平方/ 我的问题是,当...

回答 1 投票 0

R cv.glmnet 错误与手动计算不符

模型报告的测量值与我计算的手动误差不符。我正在使用 R 包 glmnet 中的 cv.glmnet 函数。我相信当我将函数变量 keep 设置为 True 时,

回答 1 投票 0

使用 RFECV 和排列重要性的正确方法 - Sklearn

Sklearn #15075 中有一个实现这一点的提案,但与此同时,建议使用 eli5 作为解决方案。但是,我不确定我是否以正确的方式使用它。这是我的代码: 来自 sklearn.dat...

回答 2 投票 0

神经网络的交叉验证:如何对待epoch数?

我正在实现一个pytorch神经网络(回归),想要确定最好的网络拓扑、优化器等。我使用交叉验证,因为我有x个测量数据库,我想

回答 2 投票 0

如何在 TensorFlow 中实现大数据集的交叉验证而不将整个数据集加载到内存中?

我目前正在为一个机器学习项目处理一个大型数据集,并选择使用 TensorFlow 的 tf.data API 来高效管理数据加载和预处理,而无需加载 en...

回答 1 投票 0

为什么我在惩罚包的情况下得到了很大的最佳收缩参数 lambda 值?

我正在研究使用LASSO(最小绝对收缩和选择算子)和Cox模型的生存分析。我使用R包penalized和optL1函数来找到最佳收缩参数la...

回答 1 投票 0

减少因果影响模型中的可信区间

我正在构建的因果影响模型遇到了问题。 我正在尝试为一家商店的每日销售情况创建一个反事实(nseasons = 7)。我已包含附近其他 5 家商店的销售额。

回答 1 投票 0

不同指标的交叉验证

当我使用Python的Sklearn进行交叉验证并获取不同指标(准确度、精度等)的分数时,如下所示: result_accuracy = cross_val_score(分类器, X_train, y_train,

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.