pandas-groupby 相关问题

用于根据给定条件将变量分组在一起。并且仅用于与“pandas”库相关

是否可以使用groupby拆分Pandas数据帧,并将每个组合并为单独的数据帧

我有一个包含分组变量的Pandas数据帧。我想根据其中一列的内容将每个组与其他数据帧合并。所以,例如,我有一个数据帧,...

回答 1 投票 1

pandas使用groupby转换创建布尔列

我试图在这样的df上使用GroupBy.transform创建一个布尔列,id类型1 1.00000 1 1.00000 2 2.00000 2 3.00000 3 2.00000代码就像,df ['has_two'] = ...

回答 2 投票 2

pandas groupby和rolling_apply忽略了NaN

我有一个pandas数据帧,我想计算列的滚动平均值(在groupby子句之后)。但是,我想排除NaN。例如,如果groupby返回[2,NaN,1],结果......

回答 3 投票 8

Groupby并在pandas中执行多个函数的聚合

我有以下数据框:日期余额01/01/2017 50 70 100 02/01/2017 100 10 190 ...... ......我正在创建一个摘要文件(按...分组)

回答 1 投票 2

相当于R data.table代码的Pandas:df [,new_column:= column2 /(1:.N),by =(column1)]

我试图找到相当于以下R data.table行的pandas。 df [,new_column:= column2 /(1:.N),by =(column1)]我想在Pandas中创建一个新列。 df与...的平均值

回答 1 投票 0

基于两个单独列中的日期范围求和

我想根据两列中的日期范围汇总一列中的所有值:Start_Date Value_to_sum End_date 2017-12-13 2 2017-12-13 2017-12-13 3 2017-12-16 2017-12-12。 ..

回答 3 投票 3

DataFrame GroupBy具有多列输出

我的目标是获取一个DataFrame对象并向其追加多个列,其中这些列是按组计算的,但这些计算不是直观可矢量化的(它们涉及累积...

回答 2 投票 0

使用pandas [duplicate]对重复列进行分组并对相应的列值求和

我正在预处理apache服务器日志数据。我有3列ID,TIME和BYTES。示例:ID&nbsp&nbsp TIME&nbsp&nbsp BYTES 1&nbsp&nbsp 13:00&nbsp&nbsp 10 2&nbsp&...

回答 1 投票 1

从合并的csv文件中分组多个对象数据类型

我正在使用数据科学训练营,目前正在考虑在pandas / jupyter笔记本中合并和排序csv文件,以便创建新的数据帧。我一直遇到的一个问题是,当我......

回答 1 投票 2

无法从熊猫分组数据中获取直方图

我有这个DF。 f = {'Router_name':['count']} a = a.groupby(['Week_end'])。agg(f)产生以下数据.Router_name计数Week_end 29 ...

回答 1 投票 0

Pandas通过列将CSV拆分为多个CSV(或DataFrame)

我很遗憾有一个问题,一些帮助或提示将不胜感激。问题:我有一个csv文件,其列可能有多个值,如:Fruit; Color; The_evil_column Apple; Red; ...

回答 3 投票 4

Python PANDAS:Groupby转换首次发生条件

我有以下一般格式的数据框:customer_id,transaction_dt,product,price,units 1,2004-01-02 00:00:00,thing1,25,47 1,2004-01-17 00:00:00,thing2 ,150,8 2,2004-01-29 00:00:00,thing2,150,...

回答 1 投票 0

使用groupby进行字数统计的问题然后使用python循环

字数和累计和我有一个数据集最多1.5百万行。该数据集是一个时间序列,年份格式如下所示。我试图累计计算每年的字符串......

回答 1 投票 1

创建用于汇总另一列的最后x次出现的列

我正在尝试创建一个新列,我们称之为“HomeForm”,即“HomeTeam”列中每个条目的“FTHG”的最后5个值的总和。对于0队来说,想法是......

回答 1 投票 1

Pandas - groupby和只有4列是相关的

我有一个81列的数据框。目前只有四个人对此感兴趣。它们被称为“传输”(对象),“复合城市MPG”(int64),“复合高速公路MPG”(int64)......

回答 2 投票 0

Pandas groupby count:仅在数字时计数

我有一个有几个领域的DF。例如:Year_end Week_end Integrado Probs Duration_hours Router_name 1225 2017 2 si 1 0.7 C3617_AI670_SARA ...

回答 1 投票 0

按两列分组,累计金额与日期为6个月的回顾窗口

原始数据集userId createDate 0级2016-05-08 22:00:49.673 2 0 2016-07-23 12:37:11.570 7 0 2017-01-03 12:05:33.060 7 1009 ...

回答 1 投票 1

每周大熊猫分组

我有一个数据帧,df包含索引日期和时间eventName eventCount 0 2017-08-09 ABC 24 1 2017-08-09 CDE ...

回答 1 投票 1

从pandas中的每个其他时间戳减去每个组的最小时间戳

我有一个DataFrame如下:Iter ID Time 0 1 A 12:00:00 1 1 B 12:00:01 2 1 C 12:00:01 3 2 B 12:02:00 4 2 A 12:02:02 5 2 ......

回答 1 投票 2

Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE

我有以下Python数据帧:类型实际预测A 4 3 A 10 18 A 13 11 B 3 10 B 4 2 B 8 33 C 20 17 C ...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.