交叉验证是一种评估和比较统计和机器学习中预测系统的方法。
如何计算 K 折交叉验证的不平衡数据集的精度、召回率和 f1 分数?
我有一个包含二元分类问题的不平衡数据集。我构建了随机森林分类器并使用了 10 折的 k 折交叉验证。 kfold = model_selection.KFold(n_splits...
内折和外折好像不太对。我不确定我是否正确使用了训练和测试数据集。 欢迎任何帮助:) ... # 缩放数据 定标器 = StandardScaler()
在数据帧上使用 TimeSeriesSplit() 应用交叉验证的最佳实践是什么,包括在 python 中可视化数据拆分?
假设我有以下 pandas 数据框格式的数据集,其中包含一个没有日期时间格式的非标准时间戳列,如下所示: +--------+-----+ |TS_24hrs|计数| +--------+-----+ |0 ...
我正在使用 lightgbm 在 R 中训练 LGBM 模型。但是,每当我调用 lgb.cv() 函数时,都会出现很多警告消息。 我的代码写成: 火车参数<- list(objective = "binary...
在嵌套的 GridSearchCV 管道中输入缺失值以避免数据泄漏
我对 sklearn 在已建立的 CV 和管道框架内估算值的方式有一些问题。所有这些都是为了避免全局插补,这会扰乱模型的性能......
NotFittedError(实例尚未安装)调用 cross_validate
这是我最小的可重现示例: x = np.array([ [1, 2], [3, 4], [5, 6], [6, 7] ]) y = [1, 0, 0, 1] 模型 = GaussianNB() scores = cross_validate(model, x, y, cv=2, scoring=(&q...
Scikit-Learn 交叉验证功能在索引不连续时不允许自定义折叠
尝试将自定义交叉验证折叠传递给 sklearn 的交叉验证功能。 交叉验证函数似乎会触发错误,因为它坚持使用基于位置的
假设我只有 100 个数据点,我想使用 10 折交叉验证方法。我应该使用多少个数据点进行训练? 我应该像往常一样将数据分成训练/测试,比如 80 ...
如何确保 nestcv.train 函数每次都返回相同的结果? Set.seed() 不工作
在这里输入图片描述 以上是我的脚本。我正在尝试使用线性 SVM 的 nestcv.train() 函数进行嵌套交叉验证 (CV)。即使我使用了 set.seed(),它给了我不同的
sklearn中RepeatedStratifiedKFold和StratifiedKFold的区别
我试图阅读 RepeatedStratifiedKFold 和 StratifiedKFold 的文档,但除了 RepeatedStratifiedKFold 重复 StratifiedKFold n 次外,无法分辨这两种方法之间的区别
连续数据,BayesianRidge 的 IterativeImputer 的 cross_val_score() binary|multiclass 不支持 Y 响应
问题定义,持续挑战 这个新的 imputer_bayesian_ridge() 函数用于 Iterative Imputer 来插补训练数据。送入data frame训练数据,立马得到data.val...
错误:在 StratifiedK-fold 期间出现“条件预期的布尔数组,而不是 float64”
我正在尝试使用 stratifid k-fold 对我的数据集进行交叉验证,但存在错误“条件预期的布尔数组,而不是 float64”(在下面的标题代码中)。做
我在多类分类上使用 5 个交叉验证来评估随机森林的性能。我得到的曲线就像图片 在此处输入图像描述 我使用的代码是...
为什么 sklearn 的 KFold 只能枚举一次(也在 xgboost.cv 中使用它)?
尝试为我的 xgboost.cv 创建一个 KFold 对象,我有 将熊猫导入为 pd 从 sklearn.model_selection 导入 KFold df = pd.DataFrame([[1,2,3,4,5],[6,7,8,9,10]]) KF = KFold(n_splits=2) kf...
如何使用 statsmodels 中常用的模型包装器来应用交叉验证?
我在这里阅读了相关讨论:Using statsmodel estimations with scikit-learn cross validation, is it possible? 在链接的讨论中,建议对来自
如何在 Bagged DecisionTreeClassifiers 上正确使用 GridSearchCV
我目前正在尝试通过 GridSearch 超参数调整一个由装有 BaggingClassifier 的 DecisionTreeclassifiers 组成的集成模型。我希望能够正确地将 Gridsearch t...
AttributeError:“Adam”对象没有属性“build”:我该如何解决这个问题
我无法用我的代码创建 Ann 模型,因为每次都会出现此错误消息。我该如何解决? 错误消息:AttributeError:'Adam' 对象没有属性 'build' 我尝试使用不同的
我正在对从 1 到 5 的多项式执行 K = 10 的 K 折练习,目的是确定哪个多项式最适合所提供的数据。尽管如此,当我尝试预测...
我编写了以下算法来实现 Ridge 回归并通过交叉验证估计其参数。特别是,我想实现以下目标: 为了交叉
是否需要先训练模型再进行K折交叉验证,还是先训练模型后进行交叉验证?
我正在实现一个神经网络的分类目的,现在我在交叉验证的麻烦我的问题是给下面。我们需要先训练模型,然后交叉验证......。