pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

逐个更改Pandas DataFrame中的dtypes

问题:我有一个只存储unicode值的Pandas.DataFrame。每列包含可以转换为整数或浮点数的值,或者保留为unicode。 (Python版本2.7.15,...

回答 1 投票 0

python pandas:不区分大小写的drop column

我有一个df,我想按标签删除一列,但不区分大小写。注意:我不想改变我的df中的任何内容,所以我想避免'str.lower'。继承人我的df:打印df姓名......

回答 1 投票 2

从不在任何其他数字之前或之后的pandas字符串列中提取最多N位数

python python-3.x pandas我对这个混合的String数据感到头疼。我在数据中有一个带有混合字母数字,文本,数字字符和长整数的数据。你能指导我...

回答 1 投票 0

re.sub错误与“预期字符串或字节类对象”

我已阅读有关此错误的多篇帖子,但我仍然无法弄明白。当我尝试循环我的函数时:def fix_Plan(location):letters_only = re.sub(“[^ a-zA-Z]”,#搜索...

回答 1 投票 21

如何从长度不等的列表中创建虚拟数据框?

我有一个字典,其中每个键是一个行索引,每个值都是一个虚拟值列表。例如:my_dict = {'row1':['a','b'],'row2':['a'],'row3':['b','c']}我可以创建一个数据帧吗? ...

回答 2 投票 3

无法在pandas中通过lambda填充多列中的NaN值

我试图在我的DataFrame all_files_d中填充所有浮点列NaN值为0,然后将其放入空列表或称为ts的DataFrame中。我的Dats样本就是这样:ColX ......

回答 3 投票 2

如何获得两个熊猫系列文本列的交集?

我有两个大熊猫系列文本列,我怎么能得到那些? print(df)0 {this,is,good} 1 {this,is,not,good} print(df1)0 {this,is} 1 {good,bad}我正在寻找...

回答 4 投票 1

数据帧行值相关

如何根据以下df在Product_Code列中找到每个行值的以下字段之间的相关性?我已经尝试过df.corr()但没有成功。实际数据......

回答 2 投票 0

迭代列列表以打印出.value_counts()

我有一个列列表,我想迭代以获取每列的.value_counts(),得到错误或我在底部发布的代码我得不到打印x = ['call_type','date_time',' ...

回答 3 投票 -2

需要聪明的循环 - 对DateTime列进行排序并测量拥挤度

我想评估每小时的ER人口。定义如下:人群(小时= x)=未出院的人(小时= x-1)+加入的人(小时= x) - 出院的人(小时= x)......

回答 1 投票 0

读取excel文件并输出具有完全相同的列数据类型的excel文件

下面的代码只是读入一个excel文件,将其存储为df并将df写回excel文件。当我在excel中打开输出文件时,列(日期,数字)不一样......有些......

回答 1 投票 1

如何用我的.apply()函数中的新列解决一个讨厌的语法错误

我正在尝试重新分类一系列字符串,这些字符串代表应用程序下载的次数,因为它没有显示下载的原始数量。我必须将20个字符串组成7个...

回答 2 投票 0

将Pandas数据帧转换为Spark数据帧错误

我正在尝试将Pandas DF转换为Spark。 DF头:10000001,1,0,1,12:35,OK,10002,1,0,9,f,NA,24,24,0,3,9,0,0,1,1,0,0 ,4,543 10000001,2,0,1,12:36,OK,10002,1,0,9,f,NA,24,24,0,3,9,2,1,1,3,1,3, 2,611 ......

回答 4 投票 20

Pandas样式的默认浮动格式

我在Jupyter中输出了大量的数据帧。列是字符串,整数和浮点数的混合。浮动需要大多数是'%.2f',但是一小部分需要特定的格式 - ...

回答 1 投票 2

使用matplotlib绘制百分位数

我有三个数据帧df1,df2和df3。我将这些组合成一个数据帧df。现在我想找到数据框中每个日期的最小值,5百分位数,25百分位数,中位数,90百分位数和最大值...

回答 1 投票 1

如何将带有索引列表的dict映射到新变量

所以,今天我正在努力解决以下问题:我有一个字典,其中每个键都是一个簇号,每个值都是一个由与该簇相关的索引号组成的列表:dic = {...

回答 1 投票 0

绘制具有已知值和有限值的数组特征的直方图

我的数据框中一个名为“宠物”的列基本上是宠物列表的一个特征:[“dog”] [“dog”,“cat”] [“cat”,“parrot”] [“dog”,“cat”,“鱼“]可能的宠物:[”狗“,”猫“,”鹦鹉“,”鱼“] ......

回答 1 投票 2

从.csv文件拆分数据并绘制图表

我有一个问题,我有一个像这样的.csv文件:Name1 x1,y1 x2,y3 x3,y3。 。 x100,y100 Name2 x1,z1 x2,z2 x3,z3。 。 x100,z100 Name3 ...... ...... Name10 ...... ...有什么办法可以拆分这个......

回答 1 投票 0

在utf8中迭代两个数据帧的列和str.encode

我目前正在运行Python 2.7并且有两个数据帧x和y。我想使用某种列表推导来迭代两列,并在每列上使用str.encode('UTF8)来获取...

回答 2 投票 1

在系列中获得小于或等于的条目数

我想得到所有元素的数量小于或等于pandas.Series中的每个条目,例如:if __name__ =='__ main__':将pandas导入pd a = pd.Series(data = [4,7,3,5] ,2,1,1,6])le = pd ....

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.