统计数据类型,其值是固定数量的名义类别之一。
我有一个这样的数据框: 原始数据框 我打算对其进行调整,使 3 种类型的奖牌成为列,它们各自的计数和平均分数成为值。像这样:
我最近发现了这个答案,它提供了 Cramer V 的无偏版本的代码,用于计算两个分类变量的相关性: 将 scipy.stats 导入为 ss def cramers_ Corrected...
Python pandas 字符串处理来自 SQL 数据库的分类数据
我有一个大数据集,需要读入 pandas 数据框。 它包含大量由一些相当长的字符串组成的分类数据。 尝试使用 pandas read_sql_query 方法我无法...
您能在seaborn中突出显示分类散点图中的具体观察结果吗?
我有 8 个类别,并且我已经使用 sns.catplot 绘制了分类散点图。有没有办法突出显示每个类别中的特定观察结果,以比较相对于...的位置
将全局 P 值添加到逻辑回归和 cox 比例风险模型 - 使用哪些测试?这是沃尔德测试吗?
我被要求为我的多变量逻辑回归模型和多变量 cox 比例风险模型中的分类变量添加全局 p 值。 我用过这个功能
我尝试使用 read_csv 作为 dtype={n: pandas.Categorical} 传递 dtype 参数,但这无法正常工作(结果是一个对象)。说明书不清楚。 可以读吗
我有一个如下所示的日期框: 城市_公司 主题 伦敦 卫生保健 西雅图 创业精神 哥本哈根 工程 墨尔本 法律 山顶风光 乙 布里斯班 C 旧金山 d 有洛...
我有一个包含“年”、“季度”、“QY”列和许多数值变量的数据集。 #示例数据集 年 = c("2019", "2020", "2021", “2019”、“2020”……
我正在考虑尝试对大量类别进行建模。我读到 catboost 有一种算法可以将类别转换为有序浮点数以优化决策树分割。算法有吗...
如何绘制 X 轴上有两个分类变量(一个嵌套,但都可见)并用其他变量填充的条形图?
我有一个包含两个分类变量、区域和函数的数据集。共有92个区域,分为13个功能类别。除了这些属于功能性区域的区域...
我有一个包含变量的数据集 “年”(2014-2023), 'Landcover2013'(分类变量 1-4), '土地覆盖2015', '土地覆盖2017', '土地覆盖2019', '土地覆盖2021', 'Sub_landcover2013' (
我有一个包含变量的数据集 “年”(2014-2023), 'Landcover2013'(分类变量 1-4), '土地覆盖2015', '土地覆盖2017', '土地覆盖2019', '土地覆盖2021', 'Sub_landcover2013' (
如果这是多余的,我深表歉意,但我尝试寻找解决方案,但没有找到任何似乎是我的问题的答案。所以,我有一堆变量的时间序列数据......
如何从 pandas DataFrame 中删除所有分类列?
分类列是节省 pandas 内存的好方法,但有时它们只会减慢速度。特别是当你过了拥有大数据的阶段之后...
我需要你的帮助,因为我是数据分析方面的新手。我有一个数据框 iv csv,其中包含有关销售业绩的数据。数据集的列是“SalesDate”作为 datetime64[ns]、“
我有一个分类变量 var1,它可以采用“W”、“B”、“A”、“M”、“N”或“P”值。我想归咎于缺失,但我知道......
如何在 Polars Dataframe 中创建非字母顺序的分类列?
在 Pandas 中,您可以从现有字符串列创建“有序”分类列,如下所示: column_values_with_custom_order = [“B”、“A”、“C”] df["
请问有没有一个Python函数可以识别大型数据集中的布尔值? 有 30 多个列? 受益人摘要文件为每个成员提供了几个慢性疾病栏。这些 是布尔字段...
在 R 中创建比例表时出错:表中的错误(st2.affect):尝试创建包含 \>= 2^31 个元素的表
我在 R Error in table(st2.affect) 中遇到此错误:当我尝试使用函数(或任何其他比例函数)时,尝试制作一个包含 >= 2^31 元素的表格 比例(表(st2.affect),m...
我有一个数据集,其中有一个名为“个体”的变量,有很多选项,就像这样。 我对某一天对不同个体 (Individual_ID) 的观察结果 不同的选择...