aggregate 相关问题

聚合是指对统计中常用的分组数据进行汇总的过程。

两列聚合,excel。电量查询

我有一个像这样的数据框 idvac idcand 事件状态 1 1 通话 是 1 1 会议号 我想要这样 idvac idcand 电话会议 1 1 是 否 是...

回答 1 投票 0

在r中如何对多个数字列中的最低数值按组进行排序?

在 R 中,我有一个包含物种列表的数据框,每个数据框都有两个带有数值的相关列(overall.percentage 和 min.range)。对于每个物种,都有多条线(代表不同...

回答 1 投票 0

过去 12 个月的计算未给出预期结果

我有一个每日数据表,我正在尝试将过去十二个月的列添加到其中,其中按 ID、产品、货币和日期截断为月份的收入总和。 我随机整理了一些...

回答 1 投票 0

Polars group_by_rolling 仅保留索引和按列

使用与上一个问题相同的数据框, pl.DataFrame( [ pl.Series("时间", ['02/01/2018 07:05', '02/01/2018 07:07', '02/01/2018 07:08', '02/01/2018 07: 09', '02/01/2...

回答 1 投票 0

折叠/将多行聚合为单行,并基于相同的 ID 共享百分比

我需要一些关于如何聚合行共享 ID 以获取百分比数据的建议/提示。 我的数据框格式为: id 县_1 国家/地区_2 国家/地区_3 .... 国家/地区_x sum_by_id 1 10 ...

回答 1 投票 0

完整案例的聚合工作

我想通过字符向量聚合多个列。然而,我认为基本 R 聚合适用于完整的情况,因此如果一个变量缺少求和变量,则该变量将被排除在外......

回答 1 投票 0

Pandas Groupby——如何从组中提取第一个、最后一个或第一个非 NaN 值

这个问题反复出现在我面前,我确信有一种方法可以将其作为 groupby().agg() 命令的一部分来实现,但我无法弄清楚。我经常需要对时间序列进行重新采样,并且需要保留一个值...

回答 1 投票 0

Pandas 中的命名滚动聚合自定义函数

我无法找到一种方法来正确命名应用于滚动窗口的自定义聚合函数。 这个答案很好地解释了 groupby 聚合。我尝试过使用 pd.NamedAggregates,就像这样 df .ro...

回答 3 投票 0

匹配/过滤/项目对象中数组中数组的嵌套字段

我需要一点帮助,我尝试从嵌套数组中提取一些字段,但仍然很困难,有人可以帮忙吗? 这是示例文档: [ { _id: 1, “_A”: [ { “_p”...

回答 1 投票 0

Dataframe聚合方法传递列表问题

这可能是一个错误,但是您对此 pandas 功能有何看法: df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) 定义 f(x): 打印(类型(x)) df.agg(f) 输出: 这可能是一个错误,但你对这个 pandas 功能有何看法: df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) def f(x): print(type(x)) df.agg(f) 输出: <class 'pandas.core.series.Series'> <class 'pandas.core.series.Series'> A None B None dtype: object 但是,如果我将 agg 方法中的函数调用包装在括号中,并将单个函数作为列表传递。 df = pd.DataFrame(np.arange(20).reshape(10,-1), columns=[*'AB']) def f(x): print(type(x)) df.agg([f]) 输出: <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> <class 'int'> A B f f 0 None None 1 None None 2 None None 3 None None 4 None None 5 None None 6 None None 7 None None 8 None None 9 None None 所有更改是将自定义函数作为单个值列表传递。 在您的情况下,您应该考虑使用 apply 而不是 agg,因为您的函数不执行多个值的聚合。

回答 1 投票 0

在 R 中按模式对数据帧进行分组

我有 R 数据框,有数百行 词频 种子 4 种子 3 合同2 承包2 河1 我想按模式对数据进行分组,比如种子+se...

回答 4 投票 0

返回 MongoDB 中没有关联文档的链接

我有一组网页存储在 MongoDB 中。每个文档至少包含一个主机名和路径名值以及在字段“a”中找到的所有链接的数组。该文档仅在...之后存在

回答 1 投票 0

根据另一个变量选择分组行

我有一个数据集,其中每个区域都有一个值 pos,但有些区域的值不是 1。 地区 <- c('A','A','B','B','C','D','D','E') pos <- c(0,1,0,1,0,0,1,0) df <- data.fr...

回答 1 投票 0

在 mongo 聚合管道的小组阶段排除某个字段,但在最后将其包含回来

我有一个 mongo 聚合查询,如下所示: db.someCollection.aggregate([ { $match: { taskId: "qy7u17-xunwqu" } }, // 按“tracklet_id”分组并计算每个

回答 1 投票 0

sql 中的分组依据和最小聚合器(带连接)

我正在尝试教我的 sql 并正在做 hackerrank 练习题。我遇到了奥利凡德的库存问题,其中内容如下:哈利·波特和他的朋友们在奥利凡德......

回答 3 投票 0

使用 R 中的特定条件聚合 nc 文件

我再次需要你的帮助。 我有 .nc 文件,元数据: 文件 minty.nc (NC_FORMAT_64BIT): 1个变量(不包括维度变量): 短 mn2t[经度、纬度、时间] 比例因子:0。

回答 2 投票 0

在 Excel 中使用列选择进行 SUMIFS

假设我有一张这样的桌子: 分支 类型 扬 二月 三月 b1 其他 100 120 130 b1 其他 10 20 30 b1 租 5 6 6 b2 租 2 2 5 b2 租 1 1 b2 其他 2 4 我想聚合数据并获得新的

回答 1 投票 0

使用explode()作为聚合函数[重复]

如何分解 pd.pivot_table() 中的重复索引行? 将 pandas 导入为 pd df = pd.DataFrame({ “组”:[1,2,2,3,1,2,3], “面板”:[1,1,1,1,2,2,2], “价值&

回答 1 投票 0

根据历史数据计算一年中每个小时和每天的天气数据平均值

我需要在r编程中根据2015 - 2023年每小时的历史数据计算一年中每一天和每一小时的气象数据平均值。每小时平均值将用于

回答 1 投票 0

如何使用多个变量从聚合数据中获取条形图下的列名称?

我有一个名为 ufc.csv 的包含树木数据的数据文件,在使用 read.csv() 函数读取它后,我使用聚合函数来获取树木直径 (Dbh) 和树木高度 (Height) 的平均值)是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.