pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

pandas读取csv忽略换行符

我有一个数据集(对于那里的compbio人,它是一个FASTA)充满了换行符,不作为数据的分隔符。有没有办法让pandas在导入时忽略换行符,...

回答 2 投票 0

如何使用pandas遍历groupby列?

我的数据框就像这样的数字,user_id,time_stamp 1 2 2013-11-15 03:45:04 2 2 2013-11-29 03:45:04 3 2 2013-12-09 03:45:04 4 2 2013- 12-25 03:45:04 5 2 2013-12-31 03:45:04 6 ...

回答 2 投票 0

pandas滚动对象如何工作?

编辑:我强调了这个问题,因为它可能太复杂了。问题的内容在下面以粗体显示。我想知道更多关于实际创建的对象...

回答 1 投票 29

Pandas - 将numpy数组存储在数据帧列中,这是函数的结果

我有一个带有allTexts列的pandas数据框,它存储了每行的一堆文本信息。我正在尝试应用自定义函数,该函数在给定输入文本的情况下返回3个值。我想要......

回答 1 投票 1

使用Numpy数组填充pandas数据帧单元时的ValueError

目标是制作一个Pandas系列,其中每个元素都是一个可变长度的numpy数组。这些数组来自函数getContexts,它获取一个数据帧cnv的掩码结果并应用...

回答 1 投票 0

将条件应用于不同的组

A B C D 0红色10.0 11.5 12.0 1红色10.5 11.5 12.0 2红色11.0 11.5 12.0 3红色12.0 11.5 12.0 4白色10.0 10.5 11.0 5白色10.5 10.5 11.0 6白色11.0 10 ....

回答 3 投票 0

连接多个pandas DataFrames

我有大量具有类似前缀df_的DataFrame,看起来像:df_1 df_x df_ab。 。 。 df_1a df_2b当然我可以做final_df = pd.concat([df_1,df_x,df_ab,... df_1a,df_2b],轴= 1)...

回答 1 投票 1

在pandas DataFrame中随机播放一个行列块

我想知道如何将DataFrame中指定的“矩形”值中的值随机地移动到位。例如,假设我想要将数据矩形中的值混洗......

回答 2 投票 0

使用sklearn进行多元线性回归

我的时间序列如下:date var1 var2 var3 var4 var5 var6 0 2004-09-30 6.252216 10.502101 4.965370 26.828754 3.321060 2.723686 1 ...

回答 1 投票 0

在Pandas中按月和任意属性求和和绘图

我目前正在进行数据分析,正在构建一个会计应用程序来跟踪我的开支。我的目标是在Django应用程序中跟踪我的费用,用Pandas对其进行一些分析......

回答 1 投票 1

使用pandas DataFrame将字典打印到文件,但更改数据帧格式

我有一个字典词典,我想打印成一个csv文件。我发现使用pandas.DataFrame执行此操作的方法:导入pandas为pd dict = {'foo':{'A':'a','B':'b'},'bar':{'C' :'c','D'......

回答 1 投票 0

使用特定行索引号或唯一ID在特定列中输入值的代码?

我想在特定列中输入某些值。我的数据看起来像:LoanID已婚申请人收入Coapplicant收入Credit_History LP00135 NaN 33460 16000 ...

回答 2 投票 1

使用长字符串将文本文件解析为数据帧格式

我在* txt文件中有以下数据;这些是前三个“线”/“行”:MO2MO2MO2:MO2MO2MO:2MO2MO2M:O2MO2M:2MO2M2 9 tagNumw 2 49 184HW5BN * 0 0 ...

回答 1 投票 1

两个数据帧的索引和列的联合

我不确定它是否是正确的表达式,但搜索合并或更改索引并没有让我任何地方。基本上我有两个数据帧:df_A = pd.DataFrame(1,index = [1,2,3],columns = [1,2,3])df_B ...

回答 1 投票 2

Python-Flask CSV文件上传错误处理[重复]

基本上我能够用我当前的代码做我想要的,上传一个csv文件,用pandas操作它然后更新MSQL数据库。我想以某种方式添加错误处理。 ...

回答 1 投票 0

计算分钟时间间隔之间的行数 - Python

我想使用groupby函数计算30分钟时间间隔的行数,从第一个单元格向下列计算30分钟间隔。这就是我所拥有的:......

回答 1 投票 2

Python / PySpark并行处理示例

我无法理解如何在我的python脚本中利用并行处理的强大功能。我有十亿行食品数据库,例如:日期,项目,类别,number_sold 2017-01-01,...

回答 1 投票 0

试图绘制熊猫表时没有出现的情节[重复]

我在CSV文件中有一些数据并且想要绘制它但是grapgh没有显示这是显示数据表和代码的屏幕截图这是CSV文件http://www.mediafire.com/file/2gtbxm5adom7m4j / ...

回答 1 投票 0

如何使用列名而不是值创建排名矩阵?

我是Python的新手。我有一个数据框,如下面的书1书2书3用户1 0.05 0.47 0.09用户2 0.3 0.01 0.35我希望它被排名...

回答 4 投票 -1

在python中滚动前3个月的独特总和

以下是我正在查看的数据集。输入: - 日期名称01/01/2017 A 01/03/2017 A 02/17/2017 A 03/17/2017 C 04/08/2017 D 05/10/2017 B 06/12/2017 D输出: - 日期......

回答 2 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.