aggregate 相关问题

聚合是指对统计中常用的分组数据进行汇总的过程。

如何使用 RDD 函数以更有效的方式执行此 groupBy + agg?

假设我创建了一个像这样的新数据框 随机导入 导入字符串 数据 = [] 对于范围(100_000)内的 i: rid = string.ascii_uppercase[random.randint(0, len(string.ascii_uppercase) - 1)] ...

回答 2 投票 0

R 中聚合数据帧以根据“检测标志”获取组的平均值

我在 R 中有数据框“fish_type”(见图)。 我想获得特定位置特定鱼类中特定化学物质的平均报告结果值。规则...

回答 1 投票 0

如何在 Polars 中按时间戳和其他列进行分组

我有一个包含许多列的数据框,只对时间戳、国家/地区、省份和人口感兴趣。 我想确定各省一段时间内的平均人口。我可以用...

回答 1 投票 0

如何计算R列中某些数据的聚合

我有一个数据集,其中包括一些育龄及以上的女性。每个女性都指定了一个 id 和包含母亲年龄的数据集。对于每个女性,我们都是平等的。 Parity1 是第一个通道...

回答 1 投票 0

新日期不能与 $match 聚合一起正常工作?

我正在尝试通过开始使用 $unwind 来破坏日期数组来过滤一些日期数据: “开始日期”:[ “2024-05-15T09:30:00.000Z”, “2024-11-13T10:00:00....

回答 1 投票 0

MongoDB。从两个集合中查询数据并在两个集合中进行过滤

我有2个收藏 产品 { "_id":"1", "订单ID":"1", “代码”:“牛肉” }, { “_id”:“2”, "orderId":&quo...

回答 1 投票 0

不带 Stream API 的集合 GroupBy 聚合

我有一个简单的ArrayList,其中包含人们的姓名和年龄(Person 对象)。 类人{ 字符串名称; 年龄; } List personList = new ArrayList<>(); personList.add(...

回答 1 投票 0

根据另一列中的所有唯一值列出所有行和列中的值,以查找每个唯一值的第 80 个百分位值

我有一个100行20列的数据框。第 1 列包含可分组的 ID。第 2 至 20 列包含整数值。目的是找到每个独特的 75 百分位值...

回答 1 投票 0

按多列分组并对其他多列求和

我有一个大约有 200 列的数据框,我想按其中的前 10 列对表格进行分组,这些列是因子,并对其余列进行求和。 我有我想要的所有列名称的列表...

回答 7 投票 0

带有聚合且计数大于语句的 SQL 查询

我原来的查询: 选择位置、项目、SUM(TxQty) AS 总计 来自 tblimInvTxHistory WHERE TxDate > '2022-01-01' AND TxCode IN ('COSHIP', 'SHIP') 按位置、项目分组 按 2 订购 这些是

回答 1 投票 0

如何在kdb/q中按符号对值求和,并输出到汇总数据的新表

我有一个表,其中包含某个品种的增量数据,我想要做的是聚合数据并创建一个汇总表,其中仅显示品种、可用数据的最早时间以及t...

回答 1 投票 0

通过expressjs中的mongoose在mongodb中进行聚合

我设计了一个数据库,其中有一个名为类别的模型。在此模型中,每个类别本身都有一个 id 和一个父属性,该属性显示该类别是否在另一个分支下(对于

回答 1 投票 0

SQL如何从我的事实表中的多行中消除或合并更少的行结果

如何消除或合并聚合表中多行的结果,减少行数? 当前情况是第一个 table#1 有 6 行: cntrc_key 重新密钥 aup_key 插入键 drvr_key

回答 1 投票 0

如何在 Pyspark 中高效地创建具有每维度总计的多维交叉表?

TL;DR:还有比这更好的方法吗? columns = ['sex', 'class', 'survived'] # 对于许多列 grouped_crosstab = sdf.groupBy(*columns).count() 对于列中的列: 分组交叉表 =

回答 1 投票 0

我想找到每个国家每年的最大数量,但我被困住了

我正在研究一个数据集,我已经清理过,现在我想显示每个国家/地区拥有最多订阅者的年份,但我陷入困境 尝试过这个: netf.query('国家!=“未指定”')\ ...

回答 1 投票 0

使用pandas GroupBy.agg()对同一列进行多次聚合

是否有 pandas 内置方法可以将两个不同的聚合函数 f1、f2 应用于同一列 df["returns"],而无需多次调用 agg() ? 示例数据框: 导入

回答 5 投票 0

使用jq根据group by统计元素

我有一个这样的电影列表: [ { “标题”:“X”, “流派”:[ { “标签”:“恐怖” }, { ...

回答 1 投票 0

在 SPARQL 聚合中获取标签

以下查询正在运行: SELECT ?goal (count(?ngo) as ?ngoCount) 哪里 {?ngo a NGO:NGORecipient; 非政府组织:hasSDGGoal ?目标。 ?目标 rdfs:标签 ?sdglabel。} 分组依据...

回答 1 投票 0

如何执行这个 DAX 公式?

我是 DAX 公式的初学者;所以我的问题是,如何使我的公式发挥作用?它说我必须使用聚合函数,因为 2016 列太大。但我想用独特的

回答 1 投票 0

使用多个过滤器在对象数组上查询 MongoDB

在 Users 集合中,我们有一个数组字段 events,它存储不同类别的事件。这是一个包含 2 个字段的对象数组:事件、类别。 我们尝试在 MongoDB 中设置一个查询来...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.