group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

基于多个标准和时间范围的聚合(R)

最终,我想将数据中的金额列聚合到尚不存在但由两个现有组和时间差维度组成的模块化组上。 我有一个达...

回答 1 投票 0

如何在 PostgreSQL 中通过 array_agg 对组进行计数

这是我的SQL: SELECT t.uid, array_agg(t.place) FROMtour_tracking t WHERE (orderon::time BETWEEN '18:00:00' AND '20:00:00') GROUP BY t.uid; 原始结果: uid 地方 A01 {香港、香港、日本} a02 {jp,...

回答 1 投票 0

如何根据结果重命名 Pandas 中的重复列

我有一个这样的数据框: DF = pd.DataFrame( { '申请日期': ['2023-06-03', '2023-05-15', '2022-02-10', '2021-12-30', '2022-09-01'], '应用程序 ID': ['1', '2', '3', '4...

回答 1 投票 0

GROUP BY 和 ORDER BY 中的列名称

我有一个工作查询,它按硬件模型和结果对数据进行分组,但问题是有很多“结果”。 我试图将其减少到“如果结果 = 0,则保留为 0,否则......

回答 5 投票 0

有没有办法根据 Pandas GroupBy 的计数在 2 个数据帧之间重复值的分布?

我有两个结构相同但形状和值不同的 Pandas 数据框: 将 pandas 导入为 pd dataframe_1 = pd.DataFrame({'customer_id': ['id1', 'id2', 'id3', 'id4', 'id5', 'id6'], ...

回答 1 投票 0

如何返回按 NULL 和 NOT NULL 分组的记录?

我有一个包含processed_timestamp列的表——如果记录已被处理,则该字段包含处理的日期时间,否则为空。 我想编写一个查询来...

回答 14 投票 0

SQL:分组以选择最大观察值

假设您有以下名为 city 的表: 市场 产品 成本 A 1 54 A 2 62 A 3 38 乙 1 12 乙 2 12 乙 3 5 我需要每个市场最昂贵的产品,即: 市场 产品 成本 ...

回答 1 投票 0

如何通过多groupby选择前X条记录

我有一个清单 列表[0]:.colA:“红色”。 colB:"大".colC:"2020".colD:"info0a".colE:"info02". 列表[1]:.colA:“红色”。 colB:“大”.colC:...

回答 1 投票 0

是否可以使用 MySQL 对多列进行分组?

是否可以在 MySQL SELECT 查询中对多个列进行 GROUP BY?例如: 按 fV.tier_id 和“f.form_template_id”分组

回答 8 投票 0

如何通过多groupby选择前X条记录

我有一个清单 列表[0]:.colA:“红色”。 colB:"大".colC:"2020".colD:"info0a".colE:"info02". 列表[1]:.colA:“红色”。 colB:“大”.colC:&...

回答 1 投票 0

SQLite GROUP BY 对 SUM 和 TOTAL 的挑战

我有一个简单的查询: 选择 日期和时间, 计数(负载)、最小(负载)、最大(负载)、总和(负载) 从 更新区域 通过...分组 日期和时间 订购依据 日期和时间; 正如你所看到的,我正在尝试...

回答 1 投票 0

从另一列中跨行组的列中删除字符串

我想从一列中删除另一列中一组行中的字符串。在下面的表示中,我想从任意行中文本中的字符串中删除片段中的字符串...

回答 2 投票 0

在 dplyr::group_by() 之后进行组内的 diff 操作

假设我有这个data.frame(有3个变量) ID 时段分数 123 2013 146 123 2014 133 23 2013 150 456 2013 205 456 2014 219 456 2015 140 78 2012 192 78 2013 19...

回答 2 投票 0

按小计和计数对 Pandas 数据框进行排序

我有一个非常大的数据集,名为 bin_df。 使用 pandas 和以下代码,我已将小计“总计”分配给每个组: bin_df = df[df["类别"].isin(模型.

回答 1 投票 0

在 Django 中对汇总值求和

我正在尝试在 Django 中实现以下 SQL 查询: (该表包含每个地点每天的购买量。我想获得每个地点的最大金额,然后按统计数据对它们进行分组...

回答 1 投票 0

树枝循环分组

假设我在数组中有一些名为“人”的数据,然后将其放入树枝模板中,如下所示: 名字 |姓氏 |颜色 弗莱德·史密斯·蓝 詹姆斯·霍姆斯·雷德 莎拉·费舍尔 B...

回答 8 投票 0

按两个变量分组,然后根据 Python 中另一个变量的值创建新列(pandas)

我可以在 R 中执行此操作,但不知道如何在 Python 中执行此操作。 我有 sbj、num_item、访问和身高的数据。 我想使用 pandas 创建基线高度。 前任: sbj 编号项 访问 高度

回答 1 投票 0

Pandas 数据框 groupby 应用具有可变参数数量的函数

我有一个pandas数据框,看起来像 将 pandas 导入为 pd 数据 = { “比赛ID”:[2,2,2,2,2,5,5,5,5,5,5], “学生ID”:[1,2,3,4,5,9,10,2,3,6,5], “theta”:[8,9...

回答 1 投票 0

Python Pandas 根据前缀匹配字符串

我在下面有一个代码,我使用 pd.read_csv 解析主机名文本文件并根据前缀进行匹配,效果很好。然而,现在有一个要求,在 sj12 中我不需要...

回答 1 投票 0

在 PeopleSoft 查询中复制 IF ANY 条件逻辑或 SUMIF 等效项

设置带有条件逻辑的表达式来确定业务逻辑中的申请类型。某些请购单可以有多个 REQ_LINE.LN_TYPE(例如,Req Line 1 = CAT & Req...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.