统计数据类型,其值是固定数量的名义类别之一。
我有一个DataFrame,其中包含许多变量,例如百分比,年,公顷等,但是我有一个是距离,我正在评估直接影响(直接影响的面积)和...的程度...]]
我有一个名为'activityNum'的分类列,这对于预测数据集中的'数量'非常重要。 activityNum在数据集中具有500多个值。值的格式为'AP ....
我正在尝试将机器学习模型转换为excel,以便数据分析人员可以交互地使用它。我想将分类变量转换为虚拟表示形式:WeekDay ...
我的问题是关于自动编码器的使用(在PyTorch中)。我有一个具有10个不同类别的分类特征的表格数据集。这些类别的名称完全不同-...
我最近从R 3.5.1更新到R 4.0.0。 read.csv的行为似乎已更改-当我在R 4.0.0中加载.csv文件时,不会自动检测到因子,而是将其识别为...
如何有效地计算类别属性的类别(250)? PostgreSQL或Python
我有一个具有50个属性(8个分类)的大数据库,我需要创建一个摘要,其中包含按城市和州分组的每个变量的所有类别的计数。属性之一具有超过250个...
我有信用贷款数据,但是原始df有许多可以位于一个客户之下的贷款ID。因此,我需要按客户端ID分组以构建客户端配置文件。原始df:contract_id','...
我有一个动物收容所的数据集,其中参数“品种”具有50多种不同的可能性。我查看了数据汇总,共有4个品种占主导地位。我的...
[在每天的购买记录中,我想应用一个聚合函数,以[]“ Bananas”,“ Apples”,“ Coke”,“。”给定的任意顺序保留一天中最重要的交易。 。
我正在此处对数据版本Cluster_Size Hardware_type 1.0.4 3 Aplha,Alpha,Aplha 1.0.2 3 Aplha,Beta,Aplha 1.0.9 3 ...实施一种热编码。
我有一个df栏,地址为“出生地”。地址是类别。 sns.countplot(df_defaulted ['birn_addr_area']。value_counts())但我需要在每个栏下方垂直显示地址。怎么做?
我正在尝试将分类列值编码为百分比频率(二进制编码),作为新功能。值计数频率(%)20190 14723 16.2%20100 11235 12.4%20120 9449 10.4%...
[我正在Keras中创建一个深度学习多分类模型,并且已经将输出标签训练集y_train从1到14的数值转换为如下所示的输出向量...
我正在使用k均值方法根据建筑物的能耗,面积(以平方米为单位)和所在位置的气候带对它们进行聚类。气候区是一个类别变量。值可以是A,B,C ...
我正在尝试说明三种方法之间A,B和C的丰度变化。 A,B和C也分为两组(“ X”和“ Y”)。我试图用ggplot绘制这些图并连接...
我正在尝试将机器学习模型转换为excel,以便数据分析人员可以交互地使用它。我想将分类变量转换为虚拟表示形式:WeekDay ...
我正在缩放基于树的分类器的数据,我知道这是没有必要的(但也不应该受到伤害)。我的大部分功能都是定量的,但我还有“ day_of_week”,剩下的是0-6(不是...
为什么与MatchIt R软件包进行精确匹配,找到具有2个不同级别的分类变量的匹配对?
我实际上正在处理金枪鱼标签捕获数据。我想在两组个人之间取得平衡,在参考区域(治疗组)中标记的个体与在...
我从2014年开始发现此线程,答案指出,不,sklearn随机森林分类器无法处理分类变量(或至少不能直接处理)。答案在2020年有变化吗?我想...
我想结合来自错误编码的分类变量(partido_pref)的一些巴西政党名称。我想合并的类别是“ PC do B”和“ PCdoB”,...