交叉验证是一种评估和比较统计和机器学习中预测系统的方法。
在sklearn cross_validate中允许多重评分并同时返回列表
我想返回多重评分,同时返回每个预测的概率分数来构建 ROC 曲线。问题是我无法返回与数字不同的东西,因为......
我使用weka和java进行分类目的,我手动进行了交叉验证,我想知道是否有办法获得评估对象的准确性,我不想要什么...
sklearn 的 cross_val_score 在 LightGBM 中对分类目标进行“f1”评分时出现错误
我的代码接收一个数据集并使用 lightgbm 对其运行分类。问题是当我尝试使用 sklearn 的 cross_val_score 进行微调时,目标列包含分类值,...
Huggingface Trainer():K-Fold 交叉验证
我正在遵循 TowardsDataScience 的本教程,使用 Huggingface Trainer 进行文本分类。 为了获得更稳健的模型,我想做 K 折交叉验证,但我不知道如何...
sklearn cross_val_score 与分类目标列的错误
我的代码接收一个数据集并使用 lightgbm 对其运行分类。问题是当我尝试使用 sklearn 的 cross_val_score 进行微调时,目标列包含分类值,...
如果我运行此代码两次或多次,我会收到类型错误。这意味着如果我运行一次,它不会显示任何错误,但如果我运行多次,它将显示错误。 公司的某些部分...
我正在使用 Kaggle 的心脏病预测数据集,并发现了一些奇怪的东西,但我找不到答案。 使用带有“liblinear”求解器的默认 Logistic 回归 (C = 1) 我...
在使用 R 中 glmnet 包中的 cv.glmnet 函数时,我一直在尝试找到训练数据集的 MSE。 任何帮助,将不胜感激。 谢谢 我想出的最好的就是下面的 b...
我有下面的代码(使用sklearn),首先使用训练集进行交叉验证,并使用测试集进行最终检查。然而,交叉验证始终表现得更好,因为......
我想使用交叉验证来测试/训练我的数据集,并评估逻辑回归模型在整个数据集上的性能,而不仅仅是在测试集上(例如 25%)。 这些...
SKlearn 中带有嵌套交叉验证的分类报告(平均值/个体值)
是否可以通过一些解决方法从 cross_val_score 获取分类报告?我正在使用嵌套交叉验证,我可以在这里获得模型的各种分数,但是,我想...
Python:逻辑回归 max_iter 参数正在降低准确性
我正在做多类/多标签文本分类。我试图摆脱“ConvergenceWarning”。 当我将 max_iter 从默认值调整为 4000 时,警告消失了。然而,我的模型
我使用 sklearn BaseEstimator 和 ClassifierMixin 构建了一个自定义 Estimator。但当涉及到交叉验证时,GridSearchCV 给我的分数是 nan 值。 这是估计器的代码:...
我想知道对 R 中的弹性网惩罚 cox 模型进行 10 倍重复 10 倍交叉验证的最佳方法是什么。我目前正在使用包 glmnet,调整 alpha...
cross_validate得到的auc和RocCurveDisplay的值不同
在训练随机森林分类器后,我尝试了两种计算 AUC 分数的方法。第一个是从 cross_validate 函数获取指标: numeric_transformer = make_pipeline(
将扩展窗口交叉验证的statsforecast实现应用于不同长度的多个时间序列
我希望通过在具有许多大学的时间序列数据集上使用 statsforecast 实施扩展窗口交叉验证来评估不同经典时间序列预测模型的准确性...
我正在尝试拟合森林物种的双变量 Cox 模型,但它返回如下所示的错误,并且我在 Spatstat 包中没有看到这些模型的另一种表述。 适合1 <- kppm(Copaif.
训练 Ridge 分类器时,我能够执行 10 折交叉验证,如下所示: clf = Linear_model.RidgeClassifier() n_folds = 10 分数 = cross_val_score(clf, X_train, y_train, cv=n_folds)
Python:GridSearchCV 花费太长时间才能完成运行
我正在尝试进行网格搜索来优化我的模型,但执行时间太长。我的总数据集只有大约 15,000 个观察值,大约有 30-40 个变量。我成功...
我正在尝试研究 Sklearn 中嵌套 CV 与非嵌套 CV 的示例。我检查了多个答案,但我仍然对这个例子感到困惑。 据我所知,嵌套简历旨在使用