pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

使用matplotlib创建多个图形的智能方法

我有一个excel工作表,让我们说它的名字是'ws_actual'。数据如下所示。项目名称日期付费实际项目金额累计金额A 2016-04-10 00:00:00 124.2 124.2 A 2016 -...

回答 2 投票 0

使用dropna()选择子集以选择多个列

我有以下DataFrame:df = pd.DataFrame([[1,2,3,3],[10,20,2,],[10,2,5,],[1,3],[2] ],columns = ['a','b','c','d'])从这个DataFrame中,我想删除子集中所有值的行[...

回答 3 投票 2

pandas从上一行中减去另一列中的值

我是Python的初学者,现在有一个数据帧(名为df)按标识符,id_number和contract_year_month排序到目前为止这样的顺序:** identifier id_number contract_year_month ...

回答 2 投票 2

合并具有相同日期的行并在pandas中添加计数器列

我有一个简单的DataFrame,如下所示:date 0 2018-08-28 13:13:37 1 2018-08-28 13:43:31 2 2018-08-28 15:23:25 3 2018-08-28 15:23:30 4 2018-08-28 15:23:33 5 2018-08 -...

回答 2 投票 3

使用Pandas读取空白分隔的三角矩阵,空单元格为零

我正在尝试使用pandas.read_table()从文本文件中读取空白分隔的下三角矩阵。矩阵的零项保留为空白。 C1 C2 C3 R1 1 R2 2 3 R3 5 ...

回答 1 投票 3

根据聚合计数对Pandas DataFrame的行进行排序,并随机获取一行

我有一个像这样的列的Pandas DataFrame:col1 col2 col3 col4 col5 a a1 foo1 foo2 foo3 b b1 foo4 foo5 foo6 c c1 foo7 ...

回答 2 投票 2

矢量化的方式来改变基于另一个数组的numpy数组值

是否存在一种矢量化(或更好)的方法,根据除此方式之外的其他方式将值设置为numpy数组的某些数据点? import numpy as np data = np.array([[1,2,3],[4,5,6],[...

回答 2 投票 2

将偶数行和奇数行分成两个新列[关闭]

我有一个简单的(稀疏的)TimeSeries:在[4]中:df.head(8)Out [4]:type 2016-09-22 04:13:00 + 00:00 00 2016-09-22 06:13: 00 + 00:00 2 2016-09-22 06:26:00 + 00:00 1 ...

回答 2 投票 0

从datetime删除时间

所以我的数据框中有一个“日期”列,日期的格式如下所示0 1998-08-26 04:00:00如果我只想要年份月份和日期,我该如何放弃琐碎的小时?

回答 2 投票 24

如何在python中扩展对象系列的长度

我有一个系列:0 2018-08-02 00:00:00 1 2016-07-20 00:00:00 2 2015-09-14 00:00:00 3 2014-09-11 00:00:00名称:EUR6m3m,dtype:object我希望将这个系列的长度延长一个......

回答 2 投票 0

python pandas loop追加数据帧

我正在尝试创建一个循环来分析时间序列数据,并在单独的pandas数据帧中平均每天“数据”。现在,如果我编制一些假的时间序列数据来实现...

回答 1 投票 1

Pandas to_sql()更新DB中的唯一值?

如何使用df.to_sql(if_exists ='append')仅附加数据帧和数据库之间的唯一值。换句话说,我想评估DF和......之间的重复。

回答 1 投票 1

Python dtype('O')。处理对象数据类型。转换为字符串/整数

我有来自ImDB的演员表。从这个表我想删除imdb_actors.birthYear缺失或小于1950的所有行,并且还删除imdb_actors.deathYear有一些...

回答 2 投票 1

如何优雅地对pandas中的一系列列表进行热编码[复制]

所以我有以下数据:>>> test = pd.Series([['a','b','e'],['c','a'],['d'],['d '],['e']])>>>测试0 [a,b,e] 1 [c,a] 2 [d] 3 [d] 4 ...

回答 1 投票 2

根据唯一列值重复数据帧行n次,并对每行重复创建具有不同值的新列

正如标题所指定的那样,我正在尝试获取重复行的数据帧。决定N次重复执行的因素是基于存在的特定列的唯一值的长度...

回答 3 投票 0

如何从pandas DataFrame生成n级分层JSON?

是否有一种有效的方法来创建分层JSON(n级深度),其中父值是键而不是变量标签?即:{“2017-12-31”:{“Junior”:{“电子”:......

回答 2 投票 7

如何在下面修改我的Python代码,将字符附加到Pandas中字符串的开头?

我正在进行数据可视化分配,我需要接收数据集并进行某些可视化。请考虑以下有关数据集的内容:列由经度表示(...

回答 2 投票 0

使用长多索引创建pandas数据透视表

我有一个数据帧df的形状(4573,64),我正试图转动。最后一列是'id',其中包含两个可能的字符串值'old'和'new'。我想将前63列设为索引...

回答 2 投票 1

如何修复numpy浮点运算产生不精确的结果?

知道样本大小,我需要从相对频率重建绝对频率。这应该很容易,但绝对频率和样本大小是numpy.int64,相对频率是numpy ....

回答 2 投票 1

Pandas列 - 使用map()函数将字符串转换为Shapely点

我有一个观察数据集,其中包含(纬度,经度)数据作为字符串,格式如下:'POINT(30.6280359000000004 -96.3051219999999972)''POINT(40.7815247999999997 -74 ....

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.