pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

在excel中使用pivot时聚合多行[duplicate]

我有以下数据:因此对于每个设备,9月,10月和11月的10个通道都有数小时的数据,这些需要在device_id上 进行旋转时进行求和,因此输出将为......

回答 2 投票 1

在Pandas中使用多个数据帧的优雅方式

我有一些目前看起来像这样的代码:if os.path.isfile('D:\\ df_1'):df_1 = pd.read_pickle('D:\\ df_1')else:df_1 = pd.DataFrame( columns = ['Date','Location','Product'])if ......

回答 1 投票 1

Pandas:在单独的列中显示嵌套的字典值

我有一个类似这样的词典列表[{“detail”:{“name”:“boo”,“id”:1},“other”:{“gender”:“m”,“no”:“234 “}},{”detail“:{...

回答 1 投票 2

pandas将group by和rows组合成列

我正在尝试将此数据集转换为:ABC 1 x1 a 1 x1 a 1 x1 b 2 x2 b 2 x2 a into:AB C1 C2 C3 1 x1 aab 2 x2 ba null df = pd.DataFrame({'A':[ 1,1,1,......

回答 2 投票 1

如何使用groupby函数根据类似的IDS创建行到列

我有数据,其形式为arun 21-09-2017 raja 21-08-2016 arun 21-10-2017 raja 21-01-2017我希望我的输入转换如下。 arun 21-09-2017 21-01-2017 raja 21-08-2016 21-01 -...

回答 1 投票 -1

如何将字符串列表的字符串转换为浮动pandas列表

我有以下数据帧(来自使用pd.read_csv的大型csv文件):sal_vcf_to_df = pd.read_csv(sal_filepath,delimiter ='\ t',header = 0,index_col = False,...

回答 1 投票 1

有效地将一列字符串转换为pandas中的几列单个字符

我有几个相当大的数据帧(> 100万行)。在一列中是不同长度的字符串。我想把这些字符串拆分成单独的字符,每个字符......

回答 3 投票 4

如何过滤空的DataFrame并仍然保留该DataFrame的列?

将我的dataframe df import pandas视为pd df = pd.DataFrame()df ['A'] = [1,2,3] df ['B'] = [4,5,6] print(df)df1 = df [df.A.apply(lambda x:x == 4)] df2 = df1 [df1.B.apply(lambda x:x == 1)] print(...

回答 2 投票 -8

从pandas groupby获得前N个结果

我在数据集中有两列:1)Supplier_code 2)Item_code我将它们分组使用:data.groupby(['supplier_code','item_code'])。size()我得到如下结果:supplier_code item_code ...

回答 1 投票 0

如何在使用pandas.DataFrame.plot()构建时间序列图时添加y轴标签

这是我的代码。我查看了文档,但没有找到答案。将pandas导入pd导入matplotlib.pyplot作为来自datetime import datetime的plt avs = pd.read_csv('...

回答 1 投票 0

每月的周数

pandas(python)是否提供了一种方法,可以轻松地从日期系列中获取当月(1:4)的当前周? data = {'date':['2014-05-01','2014-05-01','2014-05-02','2014-05-02','2014-05-02','2014 -05 -...

回答 1 投票 0

使用groupby进行字数统计的问题然后使用python循环

字数和累计和我有一个数据集最多1.5百万行。该数据集是一个时间序列,年份格式如下所示。我试图累计计算每年的字符串......

回答 1 投票 1

如何将numpy fillna()与numpy.where()一起用于pandas DataFrame中的列?

这是一个示例pandas DataFrame:导入pandas为pd import numpy as np dict1 = {'file':['filename2','filename2','filename3','filename4','filename4','filename3'],'amount ':[3,4,......

回答 1 投票 1

从Pandas DF列中提取数据/字符串

我试图使用Python pandas从poloniex API中提取货币对。我相信返回的数据只是一个列名:列:[{“BTC_BCN”:{“BTC”:“479.74697466”,“BCN”:“...

回答 1 投票 -1

按Pandas列中的值排序

我在Pandas中将我的数据分组如下:df.groupby(by = ['industry','country','category'])['category']。count()在groupby之后,DataFrame看起来像这样: --------------------------...

回答 1 投票 0

R等效python代码给出不同的输出

我试图在python中编写R等效代码,但没有得到相同的结果。 R代码如下:#设置参数max.people = 50 max.trials = 500 plot.step = 1#load libraries library(...

回答 1 投票 1

使用pandas在csv中发生python计数

我是Python的新手,我正在尝试一个小项目并且有点困惑。我有2个csv文件,如下所示:all_cars:first_Car,second_car Mazda,Skoda Ferrari,Volkswagen ......

回答 2 投票 2

如何将pandas时间数据转换为matplotlib可以处理的格式

在演讲的第3部分,我遇到了一个问题,我无法从雅虎上传任何财务数据,所以我使用pandas datareader上传微软的股票信息,这里是代码:MS = ...

回答 1 投票 1

使用groupby和head(有条件地)过滤DataFrame

我想使用pandas groupby和有条件的头来过滤这个数据帧。这是一个示例DataFrame:df = pd.DataFrame([['是',2],['是',4],['是',6],['不',8],['不', 5],...

回答 1 投票 0

排序数据透视表(多索引)

我正在尝试在数据透视表上放置两个“行标签”(Excel术语)后按降序对数据透视表的值进行排序。样本数据:x = pd.DataFrame({'col1':['a','a','b','c','c','a','b','c','a' “...

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.