pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

无法从类型对象中读取:

我有以下python代码,我试图输出到基于时间戳的目录。导入pandas为pd import pyarrow as pa import pyarrow.parquet as pq import uuid data = {'date':['...

回答 1 投票 0

如何从参数创建查询?

目标:我希望定义一个函数,它接受一个参数 - 列名和值的字典 - 并从Pandas数据框中返回匹配条件列表详细信息:我...

回答 2 投票 0

在Seaborn情节中作为X的星期几

我有一个包含点击次数和展示次数的数据集,我使用groupby和agg df2 = df.groupby('day_of_week',as_index = False,sort = True,group_keys = True)聚合它们。(''Clicks' :'和','...

回答 2 投票 1

滚动分组累积总和

我正在寻找创建滚动分组累积总和。我可以通过迭代得到结果,但想看看是否有更聪明的方法。以下是源数据的样子:Per C V 1 ...

回答 3 投票 5

熊猫:浓缩调查结果

我的调查结果具有以下格式:Lab Shepherd Poodle Frisky Sleepy Hungry 0 NaN NaN是是NaN NaN 1是NaN NaN NaN NaN是2 NaN ...

回答 2 投票 1

在pyspark数据框中选择并转换列名

我在pyspark有一个数据框。我想从该数据框中选择一些列并将它们转换为小写。 #选择数据框df中第二列之后的列作为列表:df1 = df ....

回答 1 投票 0

使用for循环将不同的数据帧连接成一个

我想将不同的财务数据框连接成一个。因此,当我手动执行2-3个库存时,我会这样做:#getting dataframe from .csv file df1 = pd.read_csv('C:\\ Users \\ Enric \\ Desktop \\ python \\ ...

回答 1 投票 1

参考Pandas SeriesGroupBy中的先前组

我正在编写一个Python脚本,用于比较每个组的最大值。我认为必须有更美妙的方式使用熊猫提供的方法或不使用全局变量,如...

回答 1 投票 0

根据是否存在破折号,有条件地在DataFrame中切割最后3个字符

我有一个大约10,000个值的DataFrame,如下所示:+ ------------ + | id | + ------------ + | 12-4253 | + ------------ + | 24-3521-01 | + ------------ + | 46-745 | + ------------ + | 13 -...

回答 2 投票 0

python - “将重新索引布尔系列键以匹配DataFrame索引。来自ipykernel导入kernelapp作为app“

menu_sub = menu [menu [“Trans Fat”] == 0] [menu [“胆固醇(%每日价值)”] == 0] [menu [“胆固醇(%每日价值)”] == 0]返回:“布尔系列键将重新索引以匹配DataFrame索引。来自...

回答 1 投票 2

时间序列数据帧,在每个月的第一个交易日增加固定头寸,如何在熊猫中完成?

我有一个dateframe df如下:date open high low close 2007/11/02 22757 22855 22564 22620 2007/11/05 22922 22964 22349 22475 2007/11/06 22540 22755 22404 22734 ...

回答 1 投票 0

这是一个带有notnull()的Pandas bug还是我的一个根本误解(可能是误解)

我有一个pandas数据帧,有两列和默认索引。第一列是字符串,第二列是日期。最高日期是NaN(虽然它应该是NaT真的)。索引somestr日期...

回答 1 投票 4

循环遍历几个pandas DataFrames的名称

我有几个来自不同文件的DataFrame,例如df001,df002等等。现在我想遍历那些DataFrame来执行类似的任务。但我无法弄清楚如何......

回答 2 投票 0

找到分钟。具有pandas / python的未来行范围的特定列中的值

我有以下数据:datetime price 2017-10-02 08:03:00 12877 2017-10-02 08:04:00 12877.5 2017-10-02 08:05:00 12879 2017-10-02 08:06: 00 12875.5 2017-10-02 08:07:00 12875.5 2017-10-02 08:08:...

回答 2 投票 0

pandas读取csv忽略换行符

我有一个数据集(对于那里的compbio人,它是一个FASTA)充满了换行符,不作为数据的分隔符。有没有办法让pandas在导入时忽略换行符,...

回答 2 投票 0

如何使用pandas遍历groupby列?

我的数据框就像这样的数字,user_id,time_stamp 1 2 2013-11-15 03:45:04 2 2 2013-11-29 03:45:04 3 2 2013-12-09 03:45:04 4 2 2013- 12-25 03:45:04 5 2 2013-12-31 03:45:04 6 ...

回答 2 投票 0

pandas滚动对象如何工作?

编辑:我强调了这个问题,因为它可能太复杂了。问题的内容在下面以粗体显示。我想知道更多关于实际创建的对象...

回答 1 投票 29

Pandas - 将numpy数组存储在数据帧列中,这是函数的结果

我有一个带有allTexts列的pandas数据框,它存储了每行的一堆文本信息。我正在尝试应用自定义函数,该函数在给定输入文本的情况下返回3个值。我想要......

回答 1 投票 1

使用Numpy数组填充pandas数据帧单元时的ValueError

目标是制作一个Pandas系列,其中每个元素都是一个可变长度的numpy数组。这些数组来自函数getContexts,它获取一个数据帧cnv的掩码结果并应用...

回答 1 投票 0

将条件应用于不同的组

A B C D 0红色10.0 11.5 12.0 1红色10.5 11.5 12.0 2红色11.0 11.5 12.0 3红色12.0 11.5 12.0 4白色10.0 10.5 11.0 5白色10.5 10.5 11.0 6白色11.0 10 ....

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.