统计数据类型,其值是固定数量的名义类别之一。
第一次在这里发帖,所以如果我遗漏了任何通常包含的细节,请告诉我。 我正在使用 ggplot2 和 ggdendro 制作带有分层聚类树的堆叠条形百分比图
我正在尝试创建一个交互式图表来在不同变量之间切换。其中一个变量是数字变量(年龄),但其他变量都是分类变量(性别、部门、职位)。我用过...
我有一些表格,其中有几个带有熊猫标签的有序类别。 我想知道哪些文件格式可用于从支持有序分类数据的 pandas 导出。 例如...
astype("category)、categorical() 和 Factorize() 有什么区别?
Python 提供了多种将变量转换为 calcategories 的方法。 将 numpy 导入为 np 将 pandas 导入为 pd mydata = pd.Series(['A', 'B', 'B', 'C']) 我的数据 0A 1乙 2乙 3C 数据类型:对象 PD.
使用分类和数值数据集训练模型时出错:无法将 NumPy 数组转换为张量(不支持的对象类型 float)
我必须训练一个神经网络来预测个体的类别。该数据集有关巴塞罗那的事故。因此,我的数据集具有分类特征和数字特征。为了...
我可以从一组逻辑回归结果创建连续变量和二元变量。然而,我正在努力从一组逻辑回归结果创建分类变量。 例如...
我有一个包含 3 个变量的图表。我有两个传奇。在“故意人类接触”的图例中,我希望只显示“威胁接触”,“友好接触”&qu...
我想为训练集和测试集创建分类字段的虚拟变量,然后仅根据训练集和测试集的共同特征来训练分类器。我正在运行以下代码
我想要一个图表,其中“vacc_status_broad”变量类别显示在图表本身中,而不仅仅是图例上。 这是我的代码 上%>% 过滤器(species_broad ==“狗”...
我有一个带有选项 1、2 和 3 的分类变量 (v0)。我想将其分为 3 个是或否变量(v1、v2、v3)。 1,2 和 3 并不相互排斥,逻辑如下: 如果 1 为真那么...
我正在尝试在线性模型中使用效果编码来比较不同样本大小的组的加权平均值。在这个虚拟示例中,我们有一组 19 个观察值......
有没有一种简单的方法可以从 pandas 数据框中获取分类列的映射?
对于一个项目,我得到了 SPSS .sav 文件中的数据,这些数据之前是使用 R 处理的。我现在正在尝试“翻译”成 Python,并且一直在使用 pandas,更具体地说...
我有一个数据集(如下),其中包含多个分类变量和数值变量。分类变量有一组独特的组合,但并非所有排列都在数据集中(...
我已经重新创建了数据结构,因此它可以帮助我更好地理解我的问题。让我们生成一些数据。 一个<- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,
有人给了我一组列表,这些列表在一个列表中,在一个列表中,你明白了。首先,抱歉,我真的不知道如何给你数据来摆弄它,我不能把它...
我正在处理一个数据集,想使用序数回归模型来分析数据。自变量之一是年龄,范围为:18-24、25-34、35-44、45-54、55-64 和 65+。 我试过
图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我只为我正在尝试做的事情提取了必要的列。 结构(列表(Date.of.Capture = struct...
Suncalc R 包 - 如何使用日照时间制作分类变量?我的逻辑论证不起作用
我已经加载了这些库,不确定你是否需要它们,但肯定需要 suncalc。 图书馆(润滑) 图书馆(dplyr) 图书馆(suncalc) 这是我的数据的前 6 行的列表。我
使用 ggplot2 绘图:分类 y 轴上的“错误:提供给连续刻度的离散值”
下面的绘图代码给出错误:提供给连续刻度的离散值 这段代码有什么问题?它工作正常,直到我尝试更改比例所以错误就在那里......我试图弄清楚......
如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考? 它只是默认使用某个级别。 lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, ...