pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

在pandas数据帧中的行之间添加随机数据

我有一个像这样的熊猫数据帧。这包含时间戳,id,foo和bar。时间戳数据大约每10分钟一次。 timestamp id foo bar 2019-04-14 00:00:10 1 0.10 0.05 ...

回答 2 投票 1

大熊猫相当于excels'文件来源'

有csv文件。在excel或pandas中打开时,外国字母变成乱码。在excel中,我转到数据 - >从文本 - >指定文件 - >步骤1并更改'文件原点',它解决了...

回答 1 投票 0

熊猫忽略了格式化程序

我有一个DataFrame z,我想用格式化打印出来[43]:值0 1.69998 1 0.98 2 0.849991现在,我想影响列的格式。我做z.to_string(formatters = ['{...

回答 3 投票 0

删除重复的反向对

给定一个Pandas Dataframe如下:value_1 value_2 0 b a 1 a b 2 c d 3 d c我想计算每对发生的次数,尽管有序。换句话说,a,b是......

回答 1 投票 1

漂亮印刷整个熊猫系列/数据框架

我在终端上使用Series和DataFrames很多。 Series的默认__repr__返回一个减少的样本,带有一些head和tail值,但其余的缺失。有内置的方式......

回答 9 投票 397

基于总行和子总行计算的行

我们如何计算前n行对Total的贡献率为80%?项目编号项目金额州1农业,林业和渔业308507俄勒冈州 - 10国内生产总值更多数据是......

回答 1 投票 0

在python中加载.db文件时出现“没有这样的表”错误

我试图在python代码中读取.db文件,而我得到“没有找到表”错误。但是当我将它导入MYSQL DB时,我可以看到该表。 import sqlite3;将pandas导入为pd; con =无......

回答 1 投票 0

如何在Python Pandas中将MultiIndex Dataframes与权重合并?

我有3个多索引数据帧,结构如下:Dataframe1:Date IDs Values Date1 ID4 0.5 ID5 2.3 ID6 3.1 ...

回答 1 投票 0

如何堆叠列和唯一值的数据帧?

我有一个大型数据框,我想从中开发一个求和表。换句话说,第1列是第一个数据框的列,第2列是每个数据框的唯一值...

回答 2 投票 1

如何获取Pandas DataFrame中的最大值/最小值

由于我的pandas数据帧的一列具有nan值,所以当我想获得该列的最大值时,它只返回错误。 >>> df.iloc [:,1] .max()'错误:512'我怎样才能跳过那个...

回答 5 投票 9

Python Pandas - 数据帧列中的查询和布尔值

我有一个包含多个列的数据框,我想根据几个标准进行查询。我的df(我不知道如何使列在主题上对齐):日期类型IsInScope ...

回答 1 投票 0

获取大熊猫中的滞后数据

我想从数据集中获取滞后数据。该数据集是按月计算的,如下所示:最终利润JCCreateDate 2016-04-30 31163371.59 2016-05-31 27512300.34 ... 2019-02-28 ...

回答 1 投票 0

Pandas fillna()无法处理DataFrame切片[重复]

Pandas fillna不用于DataFrame切片,这是一个例子df = pd.DataFrame([[np.nan,2,np.nan,0],[3,4,np.nan,1],[np.nan ,np.nan,np.nan,5],...

回答 3 投票 2

使用针对未知列数的自定义顺序对pandas中的列进行排序

我在我的pandas DataFrame DB_0,ISBN_0,ISSN_0,Title_0,e-ISBN_0,e-ISSN_,DB_1,ISBN_1,ISSN_1,Title_1,e-ISBN_1,e-ISSN_1 ...... DB_n,ISBN_n,ISSN_n,Title_n中有以下列,e-ISBN_n,e -...

回答 1 投票 -1

如何避免大型数据集的Pandas DataFrame中的for循环

你能告诉我一种优化这段代码的方法吗?由于大数据集需要几十分钟才能完成... df ['sinistre'] = 0表示index_sin,row_sin表示sinistre1.iterrows():date_surv = row_sin ['...

回答 3 投票 2

将pdsas dataframe列中的HTML转换为纯文本,该列从csv文件读取

我有一个pandas数据框,它有两列:一列包含HTML和小格式标签,如br和&nbsp,另一列名为USEFUL。我想将HTML列转换为...

回答 1 投票 1

为字典中的每个键值创建单独的pandas数据帧

我有一个字典作为dict_q:{'a':w_1 w_2 w_3 3 3 3 3 1 2 2 2'b':w_1 w_2 w_3 5 5 5 5 6 6 6 6'c':w_1 w_2 w_3。 ..

回答 1 投票 1

更快地计算pandas中列表列中值的总出现次数?

我在pandas数据框中有一个列,其中包含大量标签列表:>>> data ['SPLIT']。head(10)0 [33.23,88.72,38.93,E931.7,V09.0,041.11, 5 ... 1 [99.04,38.06,...

回答 2 投票 1

Python:每组多个统计信息[重复]

我想尝试每组进行多次统计。我可以计算每个小组,但我无法弄清楚如何获得每组的百分比。这就是我所拥有的:在我的例子中,我强迫了881 ......

回答 1 投票 -1

如何从包含Python3中特定索引和列的列表的dict创建Pandas DataFrame?

假设现在我有一个带有列表的字典:dic = {“protein1”:[“func1”,“func2”],“protein2”:[“func2”,“func3”,“func5”],“protein3”:[“ func3“,”func5“]}和索引列表:rows = [”...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.