group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

使用 GROUP BY 时如何计算不同值

我想根据 Teradata 中的“group by”语句对不同值进行计数,并将这些值保存到列中。 这是 group by 子句之后的数据示例: 团队 ID |个人...

回答 1 投票 0

在 panda 数据框中使用“groupby”和“Grouper”对日期时间对象值进行分组时出错

我在尝试根据年份对包含日期的列进行分组时遇到以下错误。 我已将列转换为日期时间对象并尝试了 groupby 和 Grouper 方法,但是 fa...

回答 1 投票 0

Pandas 复杂组通过使用另一个表中的匹配标准

我很难以一般的方式描述这个问题,这将使问题标题变得有用。但它就在这里。我正在尝试根据列中的 id 合并或分组表中的行...

回答 1 投票 0

查找每个用户有多少天步数为 0。 HAVING COUNT(x)=0 不返回任何内容

我正在使用 Fitbit 的 Kaggle 数据集,用于 Google 数据分析证书项目, 我试图找出每个用户 (id) 有多少天 0 步。 演示位于 db<>fiddle cr...

回答 1 投票 0

HAVING COUNT (COLUMN_INTEGER) = 0 不会给出任何结果,但该列确实有很多 0

我正在使用 Fitbit 的 Kaggle 数据集,用于 Google 数据分析证书项目, 我试图找出每个用户 (id) 有多少天 0 步。 这是我的查询: 选择公司...

回答 1 投票 0

过滤零值之间的行并保存为新的数据框或数据表

我有一个大型 csv 数据集,包含超过 45k 行和 19 个不同的变量。我想通过特定变量(V4)对其进行过滤,以便每个过滤组都以 0 开头,然后下一个 0 将...

回答 1 投票 0

如何在Python Pandas中使用groupby来比较两个对象列

我有一个成人数据集,有两列“薪水”和“教育”。它们都保存对象值,例如“>50k”和“Masters”。我想使用 groupby 来...

回答 1 投票 0

极坐标中的 group_by id 和时间戳(时间戳阈值 45 分钟)

我有一个带有“col1”列和“col2”列的极坐标数据框。 现在我想对两列进行分组并创建一个新列。我有以下示例数据: 数据 = { “col1”...

回答 1 投票 0

使用 GROUP BY 查找第一个订单中商品的总数量?

我正在尝试提出一个查询,该查询将从第一个订单中提取商品的总数量。我知道如何取出每件商品及其第一个订单号,但我正在尝试...

回答 1 投票 0

Pandas groupby 对巨大数据帧的当前行之前的日期进行变换均值

我有一个 Pandas 数据框,看起来像 df = pd.DataFrame([['约翰', 'A', '1/1/2017', '10'], ['约翰', 'A', '2/2/2017', '15'], [“约翰”、“A”、“2017 年 2 月 2 日”、“20”],...

回答 1 投票 0

连接 2 个表,但仅在第一个表中显示第二个表中的值一次

我绞尽脑汁想解决这个问题。我正在使用 Presto SQL。 我有 2 张桌子: trx(每日交易量): |日期 |用途 |存款 ID | | ------------| -------- |---------...

回答 1 投票 0

查找每个月的最大值,并将来自 R 数据框中其他列的信息保存下来

我有以下数据框 df_2,其中包含“日期”列, “Pre_mx”和“Prec_mn”。 “日期”列已采用“日期”格式。 日期...

回答 1 投票 0

根据 Pandas Dataframe 中组的最大值计算新列值

我有包含受试者列表+配药日期的数据框,一个受试者有多个配药日期,并且一个受试者的一个配药日期可能会出现多次。这是例子...

回答 1 投票 0

在Python-Polars中处理列类型List[int]

很多时候我发现自己处于这样的情况:我有一个 DataFrame 并且一列的类型为 List[int]。 例如,我有以下 DF: df = pl.DataFrame( {“组”:[“一个...

回答 1 投票 0

指定要搜索的年份,而不使用 WHERE 子句

我正在尝试返回 2015 年每个月的总销售额。我的表包含 2000 年到 2019 年的数据。当我在下面编写查询时,我会得到所有年份每个月的销售额。我该如何...

回答 1 投票 0

在 Jupyter Notebook 上复制 Python 3 (ipykernel) 代码时出现错误“AttributeError: 'NoneType' object has no attribute 'iloc'”

从 YouTube 上的定量分析课程中复制一些代码。复制了完全相同的代码,但在我的 Jupyter Notebook 中,弹出了标题中的错误。 从 statsmodels.regression.rolling 导入

回答 1 投票 0

GROUP BY 不适用于多个 Case 语句和左连接

我有两个表,我正在尝试编写一个包含多个 CASE 语句的 GROUP BY 子句,以便将数据分组为每个客户端的一行,而不是每个客户端的多行。 我在这里...

回答 1 投票 0

将组中具有特定值的所有行排序到组中的最后一个位置

我尝试将组中具有特定值的所有行排序到每个组中的最后一个位置。 数据 = {'a':[1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3], 'b':[100, 300, 200, 222, 500, 300, 222, 100,...

回答 2 投票 0

按连续日期范围对 Pandas DataFrame 进行分组

我有一个 Pandas DataFrame,如下所示: 将 pandas 导入为 pd 数据 = { '日期': ['2023-01-01 00:00:00', '2023-01-01 06:00:00', '2023-01-01 12:00:00', '2023-01-02 00:00:00', '...

回答 1 投票 0

如何将特定年份的值推广到组的每一行?

我有一个大型数据集,其中包含不同国家/地区每年的值。我想创建一个附加列,其中包含该国家/地区最近一年的值。 我试过过滤...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.