聚合是指对统计中常用的分组数据进行汇总的过程。
我想计算一个集合的总和,对于不同大小的部分:d =(1,2,3,4,5,6,7,8,9)sz =(2,3,4)#在这里我期望1 + 2 = 3,3 + 4 + 5 = 12,6 + 7 + 8 + 9 = 30 itd = iter(d)result = tuple(...
我想知道如何根据一个条件连接字符串以形成不同长度和不同长度的序列以及变化的内容。这是一个数据框示例(我的DF实际上是...
我有一个数据库,其中包含有关我网站上的项目的页面查看的数据。每行都有Date,ItemId(guid字符串)和Views(int)。在不同日期有许多行具有相同的ItemId。 ...
我有一个由2列组成的数据框:> head(session_item_pairs)session_id item_id 53 811 111502665618 78 841 111502665618 127 901 111502665618 151 ...
基本上,我想创建一个列ERROR RATE,它取ERROR中的YES的总和,并将其除以ERROR中的NO,但是按照每个描述的LOCATION过滤ERROR RATE。 ...
我有一个有10列的数据框。第一列属于POSIXIt格式的日期,它也有日期和时间。最后九列属于变量。数据可以在下面看到。 STR(...
我想按周汇总价值。有时第一周或最后一周将少于7天。在下面的示例中,数据从2016-01-01开始,但该周的最低日期是2015-12-27。所以 ...
我对多维立方体的经验不多,SQL和表格建模更是我的事。我正在尝试创建一个计算的度量,它是跨时间段(月)的运行总计。 ......
Python(Pandas?):具有可变列宽的CSV文件中的聚合数据
我有一个具有可变列宽的csv文件,其中每一行都是日期,区域和在该日期/区域观察到的一组ID。数据如下所示:12/01/2017,Region1,BMW_123,...
我想要过去24小时文档中的平均温度,单文档的间隔为1小时,所以我最终会期待24小时的文档
让我的mongodb数据存储一些数据与int num:850531015931 num:860338053336 num:859923992712现在我想查询聚合与正则表达式那些num以85开头,我该怎么做...
我有这样的查询:SELECT提取(从日期开始的年份),提取(从日期1开始的月份),花费FROM(SELECT *,COUNT(*)OVER(PARTITION BY CONCAT(提取物(年份FROM date1),提取物(月份FROM date1)) ))N ...
在SO上有一些类似于这个主题的问题但不完全像我的用例。我有一个数据集,其中的列布局如下所示Id描述值10 ...
LINQ Group使用Lambda通过两个对象属性和SUM,AVG或忽略其他对象属性
我有使用LINQ Lambda语法组合在一起的对象列表。公共类Candy {public string Id {get; set;} public string Name {get; set;} public string Distributor {...
我对sum()函数有点熟悉,但在这种情况下,我很难搞清楚这一点。请注意下面的数据示例**地址|国家|人民|汽车**雨圣| AZ | 25 | ...
我想用值Z来计算元素的数量。我将举例说明我需要的东西。我有大量的标签(数百万)存储在数据框中,它们的格式为<X>。作为......
如果我在带有公式的数据框架上使用聚合,即。 aggregate(cbind(a,b,c)~d + e + f,df,sum)模型列(d,e,f)的顺序是否重要?我有这个问题,因为我已经阅读了一些内容......
我有多个站点的物种数据,包括站点,年,月和日的信息。在这些数据中,对于几个物种,某些日子有多个条目。例如,3日...
我的数据帧df目前看起来像这样:cat 1 2 3 4 1 a 0 1 0 1 2 b 0 0 1 0 3 b 1 0 1 1 4 a 1 0 1 1 5 b 1 1 1 1 6 a 0 1 1 0 cat