group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

选择一组行(如果其中一行具有所需属性)

我有一个像这样的数据框: 数据<- data.frame(family.id = rep(1:6, each = 5), member.id = rep(1:5, times = 6), attribute = c(1,1,2,3,4,1,2,2,3,5,1,1,3,5,5,2,3,3,4,5,1,1,4,4,5,3,3,4,5,5) ) I ...

回答 1 投票 0

如何在没有主键的情况下合并 2 行或更多行并对 UPDATE 中的列求和

所以我在 SQL Server 中有一个表,如下所示...... | C交易 | C数量 | C项目代码| CUOM | | 001| 2 | 0011|包装| | 001| 5 | 0011|包装| | ...

回答 2 投票 0

Polars 相当于 groupby 聚合中的 Pandas idxmin 是多少?

我正在寻找在 group_by agg 操作中相当于 Pandas idxmin 的 Polars 使用 Polars 和此示例数据框: 将极坐标导入为 pl DCT = { “a”:[0, 0, 0, 0, 1, 1, 1, 1, 2, ...

回答 2 投票 0

向数据框中每个组的最后一行添加新行[重复]

我的原始数据框如下: 列表 = [['2024-05-25', '第 1 组', '第 1 年', 23466882], ['2024-05-25', '第 1 组', '第 2 年', 458397284], ['2024 -05-25', '第 1 组', '第 3 年', 2344545], ['2024-05-25', '

回答 1 投票 0

如何在数据框中提取特定条件下的某些行(Python)?

我有以下数据集 A=pd.DataFrame({ 'vol_num' : 1., 'vol_name' : pd.Categorical(["test","train","tt","tn","se",&q...

回答 1 投票 0

Linq order by、group by 和 order by 每组?

我有一个看起来像这样的对象: 公开课学生 { 公共字符串名称{获取;放; } 公共 int 等级 { 得到;放; } } 我想创建以下查询:group

回答 5 投票 0

获取数据帧中列的最大行数并保留不同行的信息

希望有人能帮助我解决这个问题。我有几个数据帧,其中包含相应的 id 和名称的值。对于每个 id,我想要所有数据帧的最大值,但我现在还必须为哪个 n...

回答 1 投票 0

SQL 视图(或查询)显示一段时间内的累积总和

假设我在名为 transactions 的 SQL 表中有以下数据,其主键为 tx_date、location、item: tx_date 地点 商品数量 费用 2024-01-01 美国...

回答 1 投票 0

选择除最小值之外的所有值,并在另一列中添加相应的最小值

考虑这张表: ID 文本 101 黑色的 102 黑色的 103 白色的 104 白色的 105 白色的 如何选择除最小 id 之外的所有 id,同时在另一列中添加相应的最小值?...

回答 1 投票 0

python DataFrame groupby 将 NaN 转换为 None 以生成有效的 json

我得到了几个必须转换和连接的json,我用pandas做了什么,然后我还必须生成一个json。 最终json的结构是固定的。 有时

回答 1 投票 0

JPA Criteria Api:在 SELECT 中使用 GROUP BY 的别名

我需要按日期时间间隔聚合一些数据。我的数据库的正确 SQL 字符串如下所示: 选择dttm_agg,计数(id) 来自表名 按 DateTime::Format("%Y-%m-%d")(dttm) 分组为

回答 1 投票 0

重塑 Pandas 数据框并按 2 级列分组

我有一个具有扁平结构的数据框,具有如下所示的唯一行。 我需要对其进行重塑,如下所示。 使用数据透视表和交换级别,我设法更接近结果......

回答 1 投票 0

Where 子句不适用于没有 Clickhouse 分组的聚合

我正在尝试使用三种不同的条件来计算总和和计数而不进行分组,并添加书面标志以将它们彼此区分开。然后我试图获得唯一一条具有某些特征的记录...

回答 1 投票 0

Python:数据框中只有 2 个唯一的列名称,总共 3105 列。如何获取按唯一列名称分组的行平均值

我的数据框 我的数据框位于链接图像中。基本上为了简单起见,我的数据框目前看起来像这样: 基因 小区_A 小区_B 小区_B 小区_B 小区_A 基因_A 0 4 35.5 4.5 3.5 格...

回答 1 投票 0

如何在PySpark中的rowsBetween中使用unboundedPreceding、unboundedFollowing和currentRow

我对接受 Window.unboundedPreceding、Window.unboundedFollowing 和 Window.currentRow 对象作为开始和结束参数的方法 pyspark.sql.Window.rowsBetween 有点困惑。 C...

回答 1 投票 0

通过pandas数据框中的记录迭代获得最小值

我创建了以下 pandas 数据框: 将 pandas 导入为 pd 将 numpy 导入为 np ds = { '趋势' : [1,1,1,1,2,2,3,3,3,3,3,3,4,4,4,4,4], '价格' : [23, 43,56,21,43,55,54,32,9,12,11,12,23,3,2,1,1...

回答 1 投票 0

Python 中 groupby 函数的奇怪行为(内存不足)

我有一个很长的代码,在某些时候有一个非常小的数据框,有 813 行和 16 列。 对于这个数据框,我应用了 groupby 函数 fm = fm.groupby(['Tower_ID' ,'Cell_ID' ...

回答 1 投票 0

pandas groupby 扩展均值不接受缺失值

我一直在寻找从以下数据集中检索基于组的扩展方法: df = pd.DataFrame({'id':[1,1,1,2,2,2],'y':[1,2,3,1,2,3]}) 和 df.groupby('id').expanding().mean().values 返回...

回答 1 投票 0

Pandas - 按相同维度分组

我有一个有五列的数据框:G1、G2、G3、G4 和税收。我按 G 和 Tax 对每个 G 列进行分组,以计算有多少行的值为 1。但是每个 G 列的结果维度不同...

回答 1 投票 0

在 pandas groupby/apply 之后删除 rownumber 列

我有这个数据(多个查询,每个查询有多个变体,每个变体有多个持续时间): 将 pandas 导入为 pd df = pd.DataFrame({ “查询”:[“q1”,“...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.