group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

如何在不使用窗口函数的情况下检索每个用户的第一次和最后一次登录时间戳

我试图从登录表中获取每个用户的第一次和最后一次登录时间戳,该表记录每次用户登录时的新时间戳。这是我的表的结构: 用户身份 登录次数...

回答 1 投票 0

使用 R 将 CSV 文件拆分为多个文件,而不更改其数据格式

我有一个 myfile.csv 文件,其列由管道 (|) 分隔,我想使用 R 将文件拆分为 2 个具有相同行数的 csv 文件,并且每个 csv 文件保留标题。 .

回答 1 投票 0

在 KQL(Kusto 查询语言)中,我可以按列(时间)进行分组并对所有其他包含整数的列求和吗?

我想生成一个符合 Grafana Cloud 中时间序列数据可视化所需格式的表格。 (更多详细信息:https://grafana.com/docs/grafana/latest/panels-visualizations/visualiza...

回答 1 投票 0

通过内连接、表间操作、array_agg提高查询性能

我使用的是DuckDB,它大部分应该遵循postgresql的语法。 我有两个表 t_cons (~200k) 和 t_flows (~1.2M)。 对于一行 t_cons 来说,有很多 t_flow 与 asset 匹配,是的...

回答 1 投票 0

Pandas 中的 groupby 对象是否存储原始数据帧的内容

我有一个 DF,其中包含名为 A、B 和 C 的三列。我的目标是查看 groupby 是否存储 DF 的副本。我的测试代码片段如下: # 用 A、B、C 列创建 Df。 grp = df.groupby(by=['A', 'B...

回答 1 投票 0

如何使用 LINQ 按多列进行分组

如何在 LINQ 中对多列进行分组? SQL 中的类似内容: 从 分组中选择 * , 我如何将其转换为 LINQ:

回答 15 投票 0

计算 R 中两个数据框中的总 N 和事件的总百分比

处理多个学期多个不同课程的数据集中的一些事件数据。我需要找出每周有多少学生“登录”课程,然后......

回答 1 投票 0

ILookup<TKey, TVal> 与 IGrouping<TKey, TVal>

我一直难以阐明 ILookup 和 IGrouping 之间的差异,并且很好奇我现在是否正确理解它。 LINQ 使问题变得更加复杂

回答 3 投票 0

如何在group by场景中使用多值函数

如果我将 GROUP BY 子句与自定义聚合函数一起使用,我的聚合函数将返回两个值。我尝试将 def 更改为 defg,但出现错误:“‘high_low_ratio_mean’列必须...

回答 1 投票 0

通过多个自定义函数优化 Pandas GroupBy 和大型数据集的聚合

我正在处理一个大型 Pandas 数据框(大约 3050 万行),我需要按多列进行分组并应用不同的自定义聚合函数。然而,目前的表现是

回答 1 投票 0

检查分组中有多少行具有 MAX 值 SQL

我的数据集如下所示: TEAM_ID PLAYER_ID NUM_POINTS 21 39 20 21 50 10 21 67 10 22 74 0 22 73 0 我是...

回答 1 投票 0

按日期对数据库表数据进行分组并对其他列求和

我有如下数据库数据: 日期、存储、带宽、成本 我可以有这样的条目: 2013-10-24, 1, 0, 0.55; 2013-10-25, 1, 0, 0.50; 2013-10-25, 1, 0, 0.25; 2013-10-25, 0, 1, 0.50; 我从...获取数据

回答 1 投票 0

使用 GROUP BY 时如何计算不同值

我想根据 Teradata 中的“group by”语句对不同值进行计数,并将这些值保存到列中。 这是 group by 子句之后的数据示例: 团队 ID |个人...

回答 1 投票 0

在 panda 数据框中使用“groupby”和“Grouper”对日期时间对象值进行分组时出错

我在尝试根据年份对包含日期的列进行分组时遇到以下错误。 我已将列转换为日期时间对象并尝试了 groupby 和 Grouper 方法,但是 fa...

回答 1 投票 0

Pandas 复杂组通过使用另一个表中的匹配标准

我很难以一般的方式描述这个问题,这将使问题标题变得有用。但它就在这里。我正在尝试根据列中的 id 合并或分组表中的行...

回答 1 投票 0

查找每个用户有多少天步数为 0。 HAVING COUNT(x)=0 不返回任何内容

我正在使用 Fitbit 的 Kaggle 数据集,用于 Google 数据分析证书项目, 我试图找出每个用户 (id) 有多少天 0 步。 演示位于 db<>fiddle cr...

回答 1 投票 0

HAVING COUNT (COLUMN_INTEGER) = 0 不会给出任何结果,但该列确实有很多 0

我正在使用 Fitbit 的 Kaggle 数据集,用于 Google 数据分析证书项目, 我试图找出每个用户 (id) 有多少天 0 步。 这是我的查询: 选择公司...

回答 1 投票 0

过滤零值之间的行并保存为新的数据框或数据表

我有一个大型 csv 数据集,包含超过 45k 行和 19 个不同的变量。我想通过特定变量(V4)对其进行过滤,以便每个过滤组都以 0 开头,然后下一个 0 将...

回答 1 投票 0

如何在Python Pandas中使用groupby来比较两个对象列

我有一个成人数据集,有两列“薪水”和“教育”。它们都保存对象值,例如“>50k”和“Masters”。我想使用 groupby 来...

回答 1 投票 0

极坐标中的 group_by id 和时间戳(时间戳阈值 45 分钟)

我有一个带有“col1”列和“col2”列的极坐标数据框。 现在我想对两列进行分组并创建一个新列。我有以下示例数据: 数据 = { “col1”...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.