group-by 相关问题

GROUP BY是SQL关系数据库标准中的一个命令,用于将共享字段值的一组行折叠为单个行。可以在组中的其他字段(例如SUM()或AVG())上执行聚合函数,以将相关数据整理为单个值。

通过分组断点突变/剪切分组数据

我有两个数据框,每个数据框都有相同的组。第一个数据帧由基础数据组成,第二个数据帧由每组的独立断点集组成。我想使用这些断点...

回答 1 投票 0

MySQL:如何计算过滤数据集上的行数(在不同条件下)?

由于我对 MySQL 的了解有限,我无法找到我想要在 MySQL 中获得的内容的正确语法(MariaDB 10.0;不可能将其升级到更新的版本): 上传最近 24 小时...

回答 2 投票 0

SQLAlchemy:将 CTE/group_by 结果映射到 ORM 实体

问题: 我有一个复杂的查询,其中在某个时刻,如果设置了标志,我最终需要 group_by() 和例如sum() 和 group_concat()。我的问题是,这样做之后我无法...

回答 1 投票 0

如何使用 group_by 并通过 Polars 应用自定义函数?

我正在绞尽脑汁试图弄清楚如何使用 group_by 并使用 Polars 应用自定义函数。 来自 Pandas,我使用的是: 将 pandas 导入为 pd 从 scipy.stats 导入 Spearmanr 定义

回答 1 投票 0

如何在 PostgreSQL 9 中用 GROUP BY 替换 DISTINCT ON?

我一直在使用 DISTINCT ON 谓词,并决定将其替换为 GROUP BY,主要是因为它“不是 SQL 标准的一部分,并且有时被认为是不好的风格,因为

回答 2 投票 0

通过 R 中的字典进行分组

我的任务是根据特定单词的使用来识别句子所属的组,例如识别使用哪种颜色来描述动物。我有字典...

回答 1 投票 0

使用另一列中的变量 min_periods 进行滚动平均

过去几年我有一个包含多个帐户的数据框,并且正在尝试获取每个帐户的列的滚动平均值,这很容易。不过我还需要 min_peri...

回答 1 投票 0

将分组依据应用于字典值

我有一个字典,其中键为字符串类型,值为整数类型列表,如下所示: 字典。 可以说我向其中添加了元素: 字典 我有一个字典,其中键为字符串类型,值为整数类型列表,如下所示: 字典. 假设我向其中添加了元素: Dictionary<string, List<int>> check2 = new Dictionary<string, List<int>>(); check2.Add("LD010101", new List<int> { 1, 2, 3 }); check2.Add("LD010201", new List<int> { 1 }); check2.Add("LD030101", new List<int> { 2, 3, 4 }); check2.Add("LD030201", new List<int> { 1, 3, 4 }); check2.Add("LD040101", new List<int> { 5, 1, 4 }); check2.Add("LD050101", new List<int> { 1, 3, 4 }); 现在我想根据整数值应用分组并过滤它。假设 group by 过滤器为 2。那么输出必须是像 Dictionary 这样的字典,因此使用过滤器 2,输出将是这样的字典: key:2, Value: {"LD010101","LD030101"} 结合使用过滤(例如使用 LINQ 的 .Where() 方法)和 List.Contains(): var filter = 2; var value = check2 .Where(el => el.Value.Contains(filter)) .Select(el => el.Key) .ToList(); var newDict = new Dictionary<int, List<string>> { { filter, value } };

回答 1 投票 0

SQL 分组然后过滤[重复]

我有两个表如下: 表 A:联系人 联系人_主要_号码 显示名称 1 史密斯、乔 2 美国能源部,唐娜 3 杰瑞、汤姆 4 贝蒂·克罗克 表 B:联系说明 联系人_备注_主要_号码

回答 1 投票 0

SQL QUERY 按时间范围报告产量 分组依据

嗨,我是 SQL 世界的新手。我想计算系统的开启和关闭时间以及每次运行时的总产量。谢谢。 这是原始数据的示例。 时间戳 系统状况 产量磅/秒

回答 1 投票 0

如何按一列分组,然后按第二列进行总结

我有一个包含两个 ID 字段的数据框,类似于以下内容: 编号1 编号2 姓名 5 6 苹果1 5 7 阿普利 6 7 应用 3 7 苹果2 我试图首先按第一个 ID 进行分组,然后按第二个 ID 进行分组,所以...

回答 2 投票 0

如何按一个 ID 字段然后按第二个 ID 字段进行分组?

我有一个包含两个 ID 字段的数据框,类似于以下内容: 编号1 编号2 姓名 5 6 苹果1 5 7 阿普利 6 7 应用 3 7 苹果2 我试图首先按第一个 ID 进行分组,然后按第二个 ID 进行分组,所以...

回答 1 投票 0

在sqlite中使用group by选择每组中的第一行

我有一个sqlite表。我正在尝试获取每组的第一行。尽管早些时候也有过同样的问题。我在 sqlite 中找不到解决方案。 我的桌子看起来像这样: ...

回答 2 投票 0

使用R studio中的Group_by函数按多个变量分组计算平均值

我有一张桌子是这样设置的 地点 复制 物种 值A A A A 1 A A 乙 2 A 乙 A 3 乙 A A 3 乙 A 乙 4 乙 乙 乙 6 乙 乙 C 2 C A A 5 C A 乙 6 我想计算 A 值的平均值...

回答 1 投票 0

获取具有不同组合的数据帧的聚合

这里完全是 pyspark 菜鸟。我有一个与此类似的数据框: df = Spark.createDataFrame([ 行(ttype='C', amt='12.99', dt='2024/01/01'), Row(ttype='D', amt='21.99', dt='2024/02/15'), 行(t类型...

回答 1 投票 0

Pandas,如何将第 1 列按第 2 列与第 1 列的绝对最大值分组,而不将第 1 列更改为绝对值?

所以可以说我有一个像这样的 df_1 : 地板紫外线 1 1 -2 2 1 3 3 1 -5 4 1 4 5 2 14 6 2 -15 我写了这段代码: 输出_df = df_1.loc[df_1.groupby("

回答 1 投票 0

按多列分组并根据未分组的列值提取顶部行

我正在尝试解决一个非常类似于以下内容的问题:https://platform.stratascratch.com/coding/10362-top-monthly-sellers?code_type=2 这里我的数据框为: 产品销售市场

回答 1 投票 0

在 Pandas 中的多列上使用 groupby 和条件 lambda 变换时出现问题

我对使用 Pandas 时出现的奇怪行为感到好奇。 我最初的目的是,对于数据中的每个组,当该列包含超过 x% 的缺失时,将列中的所有值替换为 NA

回答 1 投票 0

如何在 Pandas Dataframe 中对两列的组合列表进行分组向量化

我有一个数据框,需要从数据框列的所有可能组合中按两列进行分组 ['A','B','C','D','E','F','G' ] 将 pandas 导入为 pd d = {'A': [0,1,1,0,0,1,0,0], 'B': [1,1,...

回答 1 投票 0

pandas `.groupby()` 不会做任何事情,包括 `as_index` 如果它检测到 apply 函数没有做任何事情?

Pandas .groupby() 如果知道不需要做任何事情,它就会变得“聪明”? 有一个 df 测试 = pd.DataFrame([{'a': 1, 'b': 15}, {'a':1, 'b': 14}]) 如果我们这样做 test.groupby('a').apply(lambda x: x.iloc...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.