group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

R 中时间序列的循环和分组

我正在创建一个循环来计算面板数据集上名为“有效刻度”的代理,其中行代表日期,列代表公司。数据集的结构如下

回答 1 投票 0

检查小组成员是否做出相同的选择

MWE。 df <- tibble(ID = c(1:12), Group = c(rep(1,3), rep(2,3), rep(3,3), rep(4,3)), Choice = c( rep(1.5, 3), round(rnorm(n=9,mean=10,sd=5), digits = 1) ) )

回答 3 投票 0

如何通过两个分组变量从 pandas groupby 获取相对频率?

假设我的数据如下: 导入日期时间 将 pandas 导入为 pd df = pd.DataFrame({'datetime': [datetime.datetime(2024, 11, 27, 0), datetime.datetime(2024, 11, 27, 1), datetime.datetime(2024, ...

回答 1 投票 0

按一列分组,获取另一列的模式,并用该特定模式填充 na

我正在 Kaggle 上使用 SpaceShipTitanic 数据集。 我有一个df。我想按一列进行分组,根据该组找到第二列的模式,并将该组中的所有 np.NaN 值填充到

回答 1 投票 0

dplyr 相当于重复(),显示除第一行之外的重复行

相当于 df[duplicate(df[,subset]),] 的 dplyr 是什么,即对于基于子集列的每组重复项,保留除第一个匹配项之外的所有行? 这将显示所有重复的行,

回答 1 投票 0

如何将 pandas 时间序列索引分组为具有相同频率的组?

我有一个时间序列,行之间的子序列具有相同的时间增量,但所有子序列之间的时间增量并不相同。 系列 >>> 时间戳 2018-06-12 08:01:00 0.5456 ...

回答 1 投票 0

如何在Python中选择按不同列分组的特定条件之上的行?

我有以下数据框: ABC 1 3 2 1 7 7 1 7 7 1 5 4 2 2 1 2 8 8 2 4 5 3 5 3 3 1 9 3 4 4 我想做的是针对相同的每组......

回答 3 投票 0

如何使用 ggplot2 在具有离散 x 刻度的分组箱线图之间移动刻度和标签?

当然已经问过,但我正在努力寻找适合我的情况的明确解决方案。 如何在分组箱线图之间移动刻度(而不是以它们为中心)以便定义小时间隔? 在...

回答 1 投票 0

按浏览器对用户代理进行分组

我有一个表,每行都包含有关用户加载的页面的数据。其中一个字段是该点击的用户代理。如何按浏览器对结果进行分组?我可以按普通用户 ag 进行分组...

回答 5 投票 0

如何在 group_concat() 中使用 DISTINCT,同时还使用其分隔符参数?

我想要每个城镇和城镇组的名称: 选择城镇,GROUP_CONCAT(DISTINCT name,';') 来自我的表 WHERE 操作不为空 按城镇分组; ';'在GROUP_CONCAT中指定分隔符。如果...

回答 1 投票 0

迭代多个数据帧并根据平均值对它们进行分组

我有一个包含 81 个不同数据帧的数据帧列表。 我想计算每个数据帧中同一列的平均值。基于平均值我想比较和增长...

回答 1 投票 0

在groupByKey或groupBy之后形成列列表

我有这个输入数据框 输入_df: C1 C2 C3 一个 1 12/06/2012 一个 2 13/06/2012 乙 3 12/06/2012 乙 4 17/06/2012 C 5 14/06/2012 转换后,我想得到这种 DataFrame 组...

回答 1 投票 0

在 Polar 中按组重新采样

我正在尝试为 Polars 中的数据构建蒙特卡罗模拟器。 我正在尝试按列进行分组,对组进行重新采样,然后将聚合列表按原始顺序解压......

回答 1 投票 0

pyspark - select 和 agg 之间的区别

以下两者有什么区别 - df.select(min("工资")).show() 和 df.agg({'工资':'分钟'}).show() 另外,这两者有什么区别—— df.groupBy("离开...

回答 1 投票 0

按组检测行更改并将结果返回到原始数据框

这是我的例子。我正在分组、排序并检测从一行到另一行的变化。 将 pandas 导入为 pd 导入日期时间 my_df = pd.DataFrame({'col1': ['a', 'a', 'a', 'a', 'b', 'b', 'b'], ...

回答 1 投票 0

MySQL 查询使用 SUM 和 GROUP BY 花费太多时间

当我从查询中删除 sum 和 group by 部分时,时间显着减少到 1 秒以下。 执行上面的查询需要2分钟,除了

回答 1 投票 0

分组、排序并检测行之间的变化

我有一个数据框。我想按 col1 分组,按 col3 排序并检测 col2 中行与行之间的变化。 这是我的例子: 将 pandas 导入为 pd 导入日期时间 my_df = pd.DataFrame({'col1': ['a'...

回答 1 投票 0

Oracle SQL - 在 Group By 中使用子查询

我有两个单独运行良好的查询,我需要将它们组合起来。一个查询使用“Group By”,另一个查询使用子查询。 第一个查询: 选择 LH.AISLE AS“过道&qu...

回答 1 投票 0

尝试合并groupby结果以在单个查询中获取报告

我有一个消息表,它存储谁在什么时间向谁发送什么消息。消息表有以下列 ID号/整数 身体字符串 来自 uuid 到 uuid 插入日期时间

回答 1 投票 0

使用Pandas groupby计算加权平均值并处理NaN

我正在尝试使用groupby计算加权平均值。但是,我正在处理数据框中的空值。 df = pd.DataFrame({ '组': ['a', 'a', 'a', 'a'], 'x': [10, 20, np.nan, 2...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.