pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

使用pandas在两个条件下创建列

我正在利用熊猫做一些分析练习。我想创建一个新列,其值是两行的总和。原始数据集如下......承认性别部门Freq 0 ...

回答 2 投票 2

将UUID添加到pandas

如何使用UUID有效填充列?我的猜测是:df ['uuid'] = pd.Series([uuid.uuid1()for i in range(len(df))])但我想知道是否可以使用某种类型的内置来完成.. 。

回答 1 投票 1

Python:如何获取多个.csv文件列的第一个值+其名称并使用它们创建一个新文件

我有多个时间序列CSV数据帧构建如下:例如:1.csv,close,high,low,open,time,volumefrom,volumeto,timestamp 0,0.7,2.0,0.7,1.1,1499990400,49.17,78.14,2017- 07-14 02:00:00 1,1.98,1 ....

回答 2 投票 0

Pandas DataFrame在B列中提取与A列中的Max相关的值

这里有相对较新的Python脚本编写器,其中包含有关Pandas和DataFrames的快速问题。在Python中可能有一个更简单的方法来做我正在做的事情(在Pandas之外),所以我对所有人都开放......

回答 1 投票 2

为二进制分类任务嵌入分类数据的正确方法是什么

我想在Keras使用一个简单的前馈网络。我的一些数据值是在我将其提供给网络之前要嵌入的类别。使用以下示例数据:+ -------------...

回答 1 投票 2

Pandas循环遍历行并跳过行?

我有一个pandas数据框,其中一列中的价格和另一列中的日期时间。我要做的就是创建一个回测测试循环,说明价格是否达到某一点,跳过30行并......

回答 1 投票 0

在Pandas DataFrame中调用groupby对象时出错

我有这个数据帧:person_code #CNAE增长大小0 231 32 0.54 32 1 233 43 0.12 333 2 432 32 0.44 21 3 431 ...

回答 1 投票 0

在python中打印时,附加到列表不起作用

我正在尝试从特定场所的DBLP API中提取作者和论文题目。这是我的方法:导入json导入pandas为pd url =“http://dblp.uni-trier.de/search/publ/api?q = ...

回答 2 投票 0

在Pandas中加入dfs时的键错误

我有一个包含以下列的数据框:df1:Index(['cnpj','#CNAE','Estado','Capital_Social','#CNAEpai','#CNAEvo','#CNAEbisavo','Porte'], dtype ='object')我有另一个数据框...

回答 1 投票 1

计算Pandas中列的年增长率

我有这个数据框:人代码年高度大小... 0 73163529000108 2013 6.293900e + 07 6.292900e + 07 1 73163529000108 2012 5.206400e + 07 ...

回答 1 投票 1

在Pandas中使用groupby按列值获取前3行

我有这个数据帧:person_code类型增长大小... 0。 231 32 0.54 32 1。 233 43 0.12 333 2。 432 32 0.44 21 3。 431 ......

回答 4 投票 1

pandas:float_format和十进制符号不能正常工作

我正在尝试使用pandas的to_csv方法将pandas DataFrame df写入csv文件,其中包含以下行:df.to_csv(f,index = False,header = False,decimal =',',sep ='',float_format ='%。3f')哪个......

回答 2 投票 0

有条理地拆分pandas数据帧以绘制不同颜色

我有一对带有值的pandas数据帧,并喜欢有条件地对它进行颜色编码,例如df.plot(kind ='scatter',ax = ax1,x ='a',y ='b',c = np.where([ 'a']> 0.5,'r','g']))但是没有......

回答 1 投票 1

Python / Pandas - 当某些列表的值小于5时,如何将列表切割为前5个值?

我有以下用例,其中我有一个带有系列/列的列的pandas DataFrame。所有系列/列表的长度各不相同,但我想要接受此列表的前5个元素并设置...

回答 2 投票 2

将两个数字数据帧列合并为一个元组列[duplicate]

我想创建一个新列,将2列组合在一起。我查看了互联网,但一无所获。我该怎么做:例如:A B 50.631456 5.57871 C(50.631456,5.57871)

回答 3 投票 2

填补缺失的NAs无法正常工作

我遇到了SettingWithCopyWarning的问题,并且没有替换值。我在这个网站上进行了非常广泛的搜索,我在处理SettingWithCopyWarning方面所看到的就是使用......

回答 1 投票 0

如何通过apply函数调试pandas group

我正在努力理解我的前同事所写的功能。 def generate_df(group):date_str = str(group ['CallerLocal_Date']。iloc [-1])+'{0}:00:00'#其他一些函数......

回答 1 投票 0

如何在Python中获取pandas数据帧中的数据斜率?

我想在数据框中获得数据集的斜率(使用线性回归模型或sk-learn模型)。 df1:A B C D 0 15 25 55 100 1 15.5 25.5 56 101 2 14.8 24 ....

回答 1 投票 2

python从数据集中删除特殊值

我有一大堆电影数据。我正在使用Pandas包。在变量“预算”(是一种对象类型)中,通常有“?” charachter。现在我要删除所有包含“?”的电影在......

回答 1 投票 1

无法从类型对象中读取:

我有以下python代码,我试图输出到基于时间戳的目录。导入pandas为pd import pyarrow as pa import pyarrow.parquet as pq import uuid data = {'date':['...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.