pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

将 pandas 数据框中的多行合并为一行[重复]

我在 pandas 中有一个数据框,它为您提供了下表: 我想通过总结调用并在一行中获取类型来获得以下结果。 (你可以观察黄色的行)

回答 1 投票 0

pandas group by 在子集上返回错误的行数

我正在极大地简化这个问题(与最初的草案相比)。 给定一个具有分类类型的数据帧,如果我对数据帧进行子集化,使其仅包含一些分类值...

回答 3 投票 0

比较 pandas 中同一个 Excel 工作表中的 2 列

在Excel工作表中我想比较两列。列名称如 file_1 和 file_2。通过使用这 2 个列,想要使用 excel 公式 [countifs] 创建另一个像“diff”的列。万一...

回答 3 投票 0

如何在Python中按除少数列之外的所有列进行分组?

我想按几列(大约 40 列)进行分组并应用聚合和。 40 列是数据集的最后 40 列。我还没有找到一种优雅的方法来做到这一点。 我尝试按所有人分组

回答 2 投票 0

使用 idmax() 通过 Groupby 计算数据帧中的最大值

我有一个有 10 列的数据框。 我使用此代码来过滤我想要的行:基本上,修订日期小于截止日期(声明的变量)和职位名称的行...

回答 2 投票 0

Pandas 如何在特定日期和日期范围内的总和值之间重新采样?

(这个问题是如何使用 pandas Grouper 以 7d 频率并用 0 填充缺失天数?)的后续问题 我有以下数据框 df = pd.DataFrame({ “名字”:[“乔”,“乔”,“乔”],...

回答 2 投票 0

有没有办法取消分组熊猫数据框中的数据分组?

我有一个数据集,为了简单起见,我需要根据一列进行分组和聚合,以便我可以轻松删除一些行。完成计算后,我需要按

回答 2 投票 0

Pandas Groupby 与 idxmax 并进行变换以获得每组最大索引的值

我有以下数据框 高旗帆 0 177.73 1 1 178.48 2 2 182.10 2 3 182.48 3 4 173.66 4 5 174.40 ...

回答 4 投票 0

如何使用groupby计算vwap(成交量加权平均价格)并应用?

我已经阅读了多篇与我的问题类似的帖子,但我仍然无法弄清楚。我有一个 pandas df ,如下所示(多天): 输出[1]: 价格数量...

回答 3 投票 0

Pandas GroupBy - 仅显示具有多个唯一特征值的组

我有一个看起来像这样的 DataFrame df_things,我想在训练之前预测分类的质量 A B C 级 ----------------------- al1 bal1 cal1 船舶...

回答 3 投票 0

groupby.mean() 不起作用,而 sum()、std() 和 size() 都起作用

我正在关注密歇根大学关于Python Pandas 中的数据科学的MOOC,我在测试中遇到了一些问题。 我必须使用 groupby 函数来计算总和、平均值、大小和

回答 3 投票 0

如何在 Pandas DataFrame 索引中获取每个月的最后一天(使用 TimeGrouper)

我有一个日期不完整的数据框,我只需要每个月最后一天可用的日期/行。 我尝试使用 TimeGrouper 并获取每组的 .last() 。 将 pandas 导入为 pd idx = [pd。

回答 4 投票 0

pandas 基于多列进行分组,但在其他列上保留最重复的重复数字

我有一张表格如下。 长 拉特 输出 4050 -47.812224 -19.043365 1890.283215 5149 -47.812224 -19.043365 1890.283215 7316 -47.812224 -19.043365 1890.283215 8406 -47.812224 -19.043365 1890....

回答 2 投票 0

用groupby方式替换值

我有一个 DataFrame,其中有一列包含一些带有各种负值的不良数据。我想替换值 < 0 with the mean of the group that they are in. For missing values as NAs, I

回答 5 投票 0

Pandas groupby 没有任何聚合操作

我有一个数据框,如下所示,我正在尝试按 Col1 进行“分组”(请参阅所需的输出)。这应该是显而易见的,但我一定不是在寻找正确的关键词。我尝试的一切...

回答 2 投票 0

熊猫石斑鱼日期_时间按照市场交易时间(印度证券交易所)

以下数据为5分钟间隔 数据框名称为 df: 脚本ID 约会时间 打开 高的 低的 关闭 体积 0 201 2019-02-04 14:55:00 1408.05 1408.05 第1407章 1408 2384 1 201 2019-02-04 15:00:00 1...

回答 2 投票 0

如何去掉最后一列中的零

我正在做应用数据科学的作业。 问题: 将可再生能源百分比削减为 5 个类别。按大陆划分的前 15 名组,以及这些新的可再生百分比垃圾箱。每个国家有多少个国家...

回答 4 投票 0

当我们描述分组数据框时,25%、50%、75% 值是什么?

我正在浏览 pandas groupby 文档,当我在特定列上进行 groupby 时,如下所示: df: A B C D 0 富一 -0.987674 0.039616 1 巴一 -0.653247 -1.022529 ...

回答 6 投票 0

应用 Python Pandas 进行分组的更快方法?

如何让 Groupby Apply 运行得更快,或者如何以不同的方式编写它? 将 numpy 导入为 np 将 pandas 导入为 pd df = pd.DataFrame({'ID':[1,1,1,1,1,2,2,2,2,2],\ '价值...

回答 2 投票 0

Python pandas 中的 Groupby:快速方式

我想改进 python pandas 中的 groupby 时间。 我有这个代码: df["Nbcontrats"] = df.groupby(['客户', '月份'])['Contrat'].transform(len) 目标是计算有多少个反对...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.