aggregate 相关问题

聚合是指对统计中常用的分组数据进行汇总的过程。

如何在r中通过创建手段将长数据集转换为宽数据集?

我有以下数据集。电子邮件关系 Q1 Q2 Q3 Q4 1 [email protected] Self 1 2 2 3 2 [email protected] Peer 3 3 4 5 3 sample@...

回答 2 投票 2

在R中创建面板数据的比例变量(stateyear)

我有1990年以来各州人口中种族的人口普查数据。我想在R studio中做两件事,在年州一级。1.汇总所有那些谁是西班牙裔拉美裔的任何种族群体成... ...

回答 1 投票 -2

在PostgreSQL中连接两张表的过程中,会出现 "Agreggating "和 "连接 "的情况。

我试图使用两个不同表的汇总生成一个汇总输出表。我不清楚如何连接这两个结果。这两个表,一个列出了每个商店的所有产品, ...

回答 1 投票 0

在mongodb中转换一个以字符串格式存储的日期值,并与当前日期相减。

我需要应用一个查询来过滤小于50天的记录。为了做到这一点,我需要将当前日期减去50天,并与日期字段进行比较。我尝试的查询是:...

回答 1 投票 0

并列缩减两列在oracle中不是用表达式分组的

我试着将两列并列,并使用表达式分组,但它不起作用。SELECT employee_id, ...

回答 1 投票 0

PCA--取差值与平均值

在考虑均值的时候,数字1和2背后的直观感受是什么?这又会对性能和准确率有什么影响?数字1:pca = decomposition.PCA(n_components=4) ....

回答 1 投票 0

在案例声明中汇总数据

我想根据提交量创建4个组,然后计算每个组的提交量占总提交量的百分比,到目前为止,我使用了这个查询 SELECT CASE WHEN submit_volume。

回答 1 投票 -1

R: "添加 "2个变量(列)来创建一个聚合变量(列)?

这可能是一个奇怪的请求--我希望我的措辞是正确的。我有一个数据集(df)和三个变量(BELONG_1, GRPOR_14, ETHNIC10),我想把它们 "添加 "起来,从而得到一个集合变量(......)。

回答 1 投票 -2

各年时间累计(R)

我有10年的日降水量数据。我想得到下一年的十二月和四月之间的总降水量。另一个复杂的问题是,...

回答 1 投票 0

获取一个热编码值的Propportions,同时聚合 - Pandas - Powered by Discuz!

我有一个这样的df,日期值0 2019-03-01 0 1 2019-04-01 1 2 2019-09-01 0 3 2019-10-01 1 4 2019-12-01 0 5 2019-12-20 0 6 2019-12-20 0 7 2020-01-01 0 现在,我 ...

回答 1 投票 0

pandas DataFrame:在重复的ID块中的集合值。

给定一个有ID列和对应的值列的DataFrame,我如何在重复ID的块中聚合(比如说求和)值?例子 DF: import numpy as np import pandas as pd ...。

回答 1 投票 0

排名应该只针对特定的列值增加

我有以下数据Col1 COl2 A 20-Mar-2020 B 22-Mar-2020 A 25-Mar-2020 B 28-Mar-2020 C 04-Apr-2020 D 10-Apr-2020 E 25-Apr-2020 在我的 ...

回答 1 投票 0

Django在过滤后的反向外文字段上的最小值集合。

class Order(models.Model): ... class OrderApplication(models.Model): created_at = models.DateTimeField(auto_now=True) driver = models.ForeignKey(Driver, on_delete=models.CASCADE) ... ...

回答 1 投票 0

如何在 jOOQ 中转换 "to_json()" PostgreSQL 函数?

我正试图将以下PostgreSQL查询转换为jOOQ,但似乎找不到合适的方法来解决这个问题。下面是查询的内容。SELECT b.book_id AS b_id, b.title, b.price, b.aumant, b......。

回答 1 投票 1

在R中获取每月每列最高的5个数值的平均值。

我有一个数据框架,看起来像这样。ANDRITZ VERBUND STRABAG SE TELEKOM AUSTRIA VOESTALPINE WIENERBERGER 2009-01-29 -0.01191567 0.0252923579 -0.04838710 0.005430566 0......。

回答 1 投票 1

在pandas中,在一个聚合体中使用多个idxmin()和idmax()进行多重索引。

在 R data.table 中,使用 argmin 或 argmax 函数在一个聚合中对多列进行聚合是可能的,也很容易。例如对于DT:> DT = data.table(id=c(1,1,1,2,2,2,2,3,3,3), col1=c(......)

回答 1 投票 2

从mysql数据集中过滤数据

我是相当新的数据库和SQL一般。我的工作与MySQL数据库和从这个网站的GPS轨迹在北京,所以创建这些表,如所述。CREATE TABLE `plt` ( `...)

回答 1 投票 0

如何用Deno和MongoDB的聚合连接两个表?

现在,我正在学习Deno,并尝试用Deno和MongoDb制作简单的应用程序。到目前为止,一切都很顺利。但是今天,我想用聚合函数连接两个表。我的示例代码在这里:...

回答 1 投票 0

在 mongodb 的嵌套文档中搜索。

嗨,我有以下问题,一个保存用户联系信息的集合,它看起来像这样。[{ "_id": { "$oid": "5836b917885383034437d26b" }, "Nombre": "Juan", "...

回答 1 投票 0

Python pandas - 使用 pd.groupby().agg()获得第二高值的 Dataframe。

我有一个DF[命名为cleanData],里面有一些值和2个列,分别是custom_critirea和total_count,下面是我的DF的一部分:CUSTOM_CRITERIA TOTAL_CODE_SERVED_COCO。下面是我的DF的一部分:CUSTOM_CRITERIA TOTAL_CODE_SERVED_COUNT 8 ...。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.