聚合是指对统计中常用的分组数据进行汇总的过程。
我有一个数据库,其中包含有关我网站上的项目的页面查看的数据。每行都有Date,ItemId(guid字符串)和Views(int)。在不同日期有许多行具有相同的ItemId。 ...
我有一个由2列组成的数据框:> head(session_item_pairs)session_id item_id 53 811 111502665618 78 841 111502665618 127 901 111502665618 151 ...
基本上,我想创建一个列ERROR RATE,它取ERROR中的YES的总和,并将其除以ERROR中的NO,但是按照每个描述的LOCATION过滤ERROR RATE。 ...
我有一个有10列的数据框。第一列属于POSIXIt格式的日期,它也有日期和时间。最后九列属于变量。数据可以在下面看到。 STR(...
我想按周汇总价值。有时第一周或最后一周将少于7天。在下面的示例中,数据从2016-01-01开始,但该周的最低日期是2015-12-27。所以 ...
我对多维立方体的经验不多,SQL和表格建模更是我的事。我正在尝试创建一个计算的度量,它是跨时间段(月)的运行总计。 ......
Python(Pandas?):具有可变列宽的CSV文件中的聚合数据
我有一个具有可变列宽的csv文件,其中每一行都是日期,区域和在该日期/区域观察到的一组ID。数据如下所示:12/01/2017,Region1,BMW_123,...
我想要过去24小时文档中的平均温度,单文档的间隔为1小时,所以我最终会期待24小时的文档
让我的mongodb数据存储一些数据与int num:850531015931 num:860338053336 num:859923992712现在我想查询聚合与正则表达式那些num以85开头,我该怎么做...
我有这样的查询:SELECT提取(从日期开始的年份),提取(从日期1开始的月份),花费FROM(SELECT *,COUNT(*)OVER(PARTITION BY CONCAT(提取物(年份FROM date1),提取物(月份FROM date1)) ))N ...
在SO上有一些类似于这个主题的问题但不完全像我的用例。我有一个数据集,其中的列布局如下所示Id描述值10 ...
LINQ Group使用Lambda通过两个对象属性和SUM,AVG或忽略其他对象属性
我有使用LINQ Lambda语法组合在一起的对象列表。公共类Candy {public string Id {get; set;} public string Name {get; set;} public string Distributor {...
我对sum()函数有点熟悉,但在这种情况下,我很难搞清楚这一点。请注意下面的数据示例**地址|国家|人民|汽车**雨圣| AZ | 25 | ...
我想用值Z来计算元素的数量。我将举例说明我需要的东西。我有大量的标签(数百万)存储在数据框中,它们的格式为<X>。作为......
如果我在带有公式的数据框架上使用聚合,即。 aggregate(cbind(a,b,c)~d + e + f,df,sum)模型列(d,e,f)的顺序是否重要?我有这个问题,因为我已经阅读了一些内容......
我有多个站点的物种数据,包括站点,年,月和日的信息。在这些数据中,对于几个物种,某些日子有多个条目。例如,3日...
我的数据帧df目前看起来像这样:cat 1 2 3 4 1 a 0 1 0 1 2 b 0 0 1 0 3 b 1 0 1 1 4 a 1 0 1 1 5 b 1 1 1 1 6 a 0 1 1 0 cat
我用于聚合第一个集合用户的两个模式具有_id作为Objectid()第二个集合UsersDetails将userId作为String。它给了我空数组的结果。有什么办法......
mongoDB mapreduce需要很长时间才能运行3m文件
我有一个包含300万份文件的集合。每个文档有40个字段。字段如下。 {“b_date”:“2016-04-05”,“d_date”:“2016-06-25”,“pos”:“MISC”,“origin”......