统计数据类型,其值是固定数量的名义类别之一。
具有 5 个分类特征和 5 个数值特征且只有 1 个数值输出的优化问题
我想找到产生所需输出的分层复合材料的结构参数。 考虑一下我有一个分层结构。层数为5。每层的厚度为...
我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...
我正在尝试对分类数据和数字数据的混合运行 XGBoost。虽然我能够训练模型并进行预测,但我无法将模型输出转储到 df 或 json。相反,我得到了错误:...
我开发了一个 ML 模型,它可以根据预测变量集(x1、x2、x3 等)对某些目标进行可变 Y 分类。我的任务是以 HTML 形式创建某种“计算器”
使用 match.it 比较倾向得分匹配后分类结果和连续结果的分布
我使用match.it进行倾向得分匹配,使用cem方法进行生存分析。但是,我也有兴趣比较几个分类和连续(停留时间)
我有一个具有以下结构的数据框: 数据<- data.frame( values = c (2, 5, 6, 7, 4, 6, 8, 9, 6, 8, 10, 13), race = c("black", "bl...
我成功创建分类值后,它们的结果是NaN。 我使用了这个命令: df['Memory']= pd.cut(pd.to_numeric(df['RAM'], errors="coerce"), [0,4,8,12],
我需要为 RAM 类别创建分类变量。 基本:RAM [0-4] 中级:RAM [5-8] 高级:RAM [8-12] 命令: df['Memory']=pd.cut(df['RAM'], [0,4,8,12], include_lowest=True, la...
除了默认对比代码(contr.treatment / contr.sum / contr.helmert)之外,我还想在 R 中使用一些用户定义的对比。然而,我读过的指南表明这些......
这是我的代码: 超过 %>% 选择(circumstances_bite,circumstances_bite_broad)%>% drop_na() %>% ggplot(aes(y=fct_infreq(circumstances_bite), fill = circumstances_bite_broad))+
我试图了解两个或三个分类变量之间可能存在的不同类型的独立性。 你能提供三个边缘变量的真实世界示例吗
我写了这个函数来将一个只有观察到的类别组合的分类变量数据集转换成一个包含所有可能组合的数据集...
我在 R(和 tidyverse)中工作,数据来自包含 11 个问题的问卷,每个问题都以 4 分李克特量表回答: 低于正常 不超过正常 超过正常 更多...
如何更改 plot(allEffects()) 中分类 x 轴变量的顺序以进行线性回归?
我的整体数据框被命名为“Cohort_new”。我有一个线性回归,其中我的预测变量 (COI) 被分成标记为“非常低”、“低”、&
我有一个看起来像这样的数据集: 平台 twitter_context facebook_context insta_context 推特 井号 北美 北美 Facebook 北美 脸书群组 北美 Instagram的 北美 北美 人士 Instagram的 N...
如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...
我有一个 LSTM 模型 (keras),它接收 6 个变量的过去 20 个值作为输入,并预测其中 3 个变量的未来 4 个值。换句话说,我有 6 个时间序列,我正在尝试
我在 R 中使用一个长格式数据文件,其中包含按参与者 ID 分组的三个时间点的性别认同。 示例文件在这里: 自由<- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4,5,5,...
上下文 我有一个分类数据系列。我的目标是将其转换为上例中的索引。但是,还有两个其他要求: nan 值应该保持 nan 而不是转换......
TypeError:使用 ColumnTransformer 时“ABCMeta”对象不可订阅
我读过很多关于这个话题的问题,但没有一个是我面临的同一个问题,也没有一个有我需要的答案。所以我希望有人至少可以对此有所了解。 我是