统计数据类型,其值是固定数量的名义类别之一。
如何找到一个分类变量是最后一个活动的日期? 我有这些数据框架,我想创建一个额外的列,告诉我类别以前处于活动状态的日期。 DF
<- data.frame( Date = rep(c("10-12-2024", "10-17-2024&
我需要创建一个模型来预测两个分类变量“您的主堆栈”和“位置”,并使用其余自变量作为预测变量。 仅处理一个预测变量很容易,...
固定效应模型矩阵存在秩缺陷,因此在将年龄分为四类后删除 5 列/系数(lme4 包)
这个问题似乎是重复的,但是我无法通过查看模型上的现有建议来解决我的情况。我正在尝试拟合三级随机截距模型。 id...
对于我正在研究的推荐问题,大约有50000个独特品牌和3级产品类别,level_1_cat(50个类别)、level_2_cat(100个类别)和level_3_cat(1000个
获取FactoMineR包中定量和定性变量的相关表[已关闭]
使用 FactoMineR 包,我对生物数据集进行了 PCA,其中每列是一个基因 (n = 15),行是不同的样本。有许多分类变量列(
我目前正在进行一项研究,旨在比较接受特定类型脑部手术的患者的术后并发症。在我们的一项分析中,我们希望...
有什么方法可以在 Julia DataFrames 中快速收集分类特征吗?
我正在使用 Julia 0.6.3 和 Dataframes.jl 我想知道是否有什么方法可以在 Julia 中轻松获得分类特征? 对于大型数据集,不可能手动输入所有内容。 我的
我正在尝试制作一个小型数据科学工具(有点像迷你版的 WEKA)。现在,我的数据集包含大量特征(70-100+),而且它们大多是分类的。我正在使用
我正在尝试理解 R 中的回归。我正在尝试解决一个具有 100 个随机男女数据集的练习,如下所示: 性别 收缩压 体重指数 男 130 40.0 女 126 29.0 女性...
如何将 pandas 数据框的单列转换为字符串类型?在下面的住房数据 df 中,我需要将邮政编码转换为字符串,以便当我运行线性回归时,邮政编码被视为
在(Hmisc::describe 文档](https://cran.r-project.org/web/packages/Hmisc/Hmisc.pdf)(第76页)中写道: 该函数判断变量是否为字符、因子、
我正在使用未标记的包针对预测占用模型绘制协变量,我的三个协变量是连续的,因此我使用预测函数和 ggplot、geom_ribbon 进行了绘制。然而
我有一个变量x,我想将其分为具有相同观察值的三组。然而,由于分位数的关系,使用分位数并不会产生最平等的组,因为分位数截止点可能......
为什么 max() 不起作用,但 idxmax() 对 Pandas 中的“类别”dtype 起作用?
为什么 max() 不起作用,但 idxmax() 对 Pandas 中的“类别”数据类型起作用? 将 pandas 导入为 pd s = pd.Series([1, 4, 3], 索引=['a', 'b', 'c']) s = s.astype('类别') # print(s.max()) # 它不...
我有一个包含 NA 值的类因子长向量。 # 简单的例子 x <- factor(c(NA,'A','B','C',NA), levels=c('A','B','C')) For purposes of modeling, I wish to replace these NA val...
我有一个很长的数据框(数百万行,几列)。为了运行固定效应回归,我想使用因子函数将分类变量声明为因子,但这非常
R 中有一个很好的解决方案。 我的 df.column 看起来像: 视窗 视窗 苹果 苹果 苹果 Linux 视窗 ... 我想在此 df.column 向量中用“其他”替换低频类别。例如...
我是机器学习新手,想了解更多有关分类的信息。我有一个包含 n=600 个评分样本和数千个潜在指标的小数据集,所有指标都是分类的(正确或错误)。基本上,我会...