pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

pandas:删除多个列,这些列在列表中命名并分配给新的数据帧

list = ['pymnt_plan','recoveries','collection_recovery_fee','policy_code','num_tl_120dpd_2m','hardship_flag','debt_settlement_flag_date','settlement_status','settlement_date','...

回答 2 投票 -2

无法读取之前读过的excel文件就好了吗?

我一直在使用python 3.7+和pandas的read_excel()函数将不同的excel文件读入Spyder IDE。一切都运作良好数月。然而,突然之间突然间,我开始......

回答 2 投票 1

pandas,groupby但只有一定数量

我有一个用户行为数据。用户查看项目。 user_id,item_id,timestamp 1,a,1000 2,b,1001 1,c,1002 1,d,1004 1,e,1005 1,a,1006 2,f,1007从概念上讲,我对此观看...

回答 1 投票 1

为dataframe python列中的每个唯一值创建excel工作表

我有一个非常大的CSV文件,包含250,000多条记录,需要一段时间才能在Excel中进行任何分析,因此我希望根据特定的计算列将其拼接成多个工作表,我...

回答 1 投票 0

通过迭代pd数据帧来刮擦多个网页

我试图通过迭代Pandas数据框(“名称”)来抓取一组网页,该数据框包含要插入网页URL的名字和姓氏。我已经设置了空列表(“合作”,“......

回答 1 投票 0

使用前一行和当前行的值之和填充数据帧行

以下代码创建了我的起点数据框:将pandas导入为pd import numpy as np d = {'PX_LAST':[1,2,3,3,3,1,2,2,1,1,3, 3], '毫安':[2,2,2,2,2,2,2,2,2,2,2,2], '动作':[0,0,1,0,0,.. 。

回答 1 投票 0

Python Pandas根据日期从1个表创建5个excel文件

日期存储为日期时间。我不想硬编码日期。我希望脚本查找具有相同日期的列,将它们组合在一起并导出到文件名中包含日期的文件。 ...

回答 2 投票 0

使用Pandas HDFStore以只读模式打开文件

我需要Pandas版本之间的兼容性,所以pickle是不够的,我存储了一堆像这样的数据帧:import pandas as pd hdf = pd.HDFStore('storage.h5')hdf.put('mydata',...

回答 1 投票 1

如何绘制直方图的密度而非计数? (Matplotlib)

我有一个名为'train'的数据框,其中包含列'string'和列'string length'以及列'rank',其排名范围为0-4。我想创建一个字符串长度的直方图...

回答 1 投票 0

使用单热编码处理sklearn中的分类变量

有人可以帮助任何现有的Python类用于sklearn的分类编码器,勾选以下复选框吗? pandas friendly - 返回数据帧的选项应该能够删除1列...

回答 1 投票 0

如何获得与R一样的Pandas数据帧的类似摘要?

不同的尺度允许不同类型的操作。我想指定数据帧df中列的比例。然后,df.describe()应该考虑到这一点。示例名义规模:A ......

回答 2 投票 5

计算,比较和聚合pandas数据帧

我的数据如下所示:ID my_val db_val a X X a X X a Y X b X Y b Y Y b Y Y c Z X c X X c Z ...

回答 2 投票 0

逐个更改Pandas DataFrame中的dtypes

问题:我有一个只存储unicode值的Pandas.DataFrame。每列包含可以转换为整数或浮点数的值,或者保留为unicode。 (Python版本2.7.15,...

回答 1 投票 0

python pandas:不区分大小写的drop column

我有一个df,我想按标签删除一列,但不区分大小写。注意:我不想改变我的df中的任何内容,所以我想避免'str.lower'。继承人我的df:打印df姓名......

回答 1 投票 2

从不在任何其他数字之前或之后的pandas字符串列中提取最多N位数

python python-3.x pandas我对这个混合的String数据感到头疼。我在数据中有一个带有混合字母数字,文本,数字字符和长整数的数据。你能指导我...

回答 1 投票 0

re.sub错误与“预期字符串或字节类对象”

我已阅读有关此错误的多篇帖子,但我仍然无法弄明白。当我尝试循环我的函数时:def fix_Plan(location):letters_only = re.sub(“[^ a-zA-Z]”,#搜索...

回答 1 投票 21

如何从长度不等的列表中创建虚拟数据框?

我有一个字典,其中每个键是一个行索引,每个值都是一个虚拟值列表。例如:my_dict = {'row1':['a','b'],'row2':['a'],'row3':['b','c']}我可以创建一个数据帧吗? ...

回答 2 投票 3

无法在pandas中通过lambda填充多列中的NaN值

我试图在我的DataFrame all_files_d中填充所有浮点列NaN值为0,然后将其放入空列表或称为ts的DataFrame中。我的Dats样本就是这样:ColX ......

回答 3 投票 2

如何获得两个熊猫系列文本列的交集?

我有两个大熊猫系列文本列,我怎么能得到那些? print(df)0 {this,is,good} 1 {this,is,not,good} print(df1)0 {this,is} 1 {good,bad}我正在寻找...

回答 4 投票 1

数据帧行值相关

如何根据以下df在Product_Code列中找到每个行值的以下字段之间的相关性?我已经尝试过df.corr()但没有成功。实际数据......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.