pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

Python Pandas不要重复项标签

我有一个表:表如何汇总组,以便组号不重复?我不想pd.df.groupby,因为我不想总结其他列。我只想不重复项目......

回答 1 投票 0

Python pandas计算日期之间的距离

我有两个数据帧。一旦常规数据帧:df Datum ... 2014-12-30 23:00:00 2014-12-30 23:15:00 2014-12-30 23:30:00 2014-12-30 23:45:00 2014-12-31 00:00:00 ... 2015 -...

回答 1 投票 1

ValueError:输入包含NaN,无穷大或对于dtype('float64')来说太大的值,使用来自KNeighborsRegressor的拟合

在尝试拟合之前,我彻底清理了我的数据框,并确保整个数据框没有inf或NaN值,并且由完全非null的float64值组成。但是,我 ...

回答 1 投票 1

如何使用fillna()函数在python中填写分类变量的NA / Null

我有一个包含一些分类变量的数据集,它们有一些缺失(NA / Null)。我想用该列的模式填充这些NA / Null。我累了以下的东西,但这不起作用......

回答 1 投票 0

按特定值填充缺失值Pandas Dataframe

我有一个数据集,我想用bfill填充“value”列中的缺失数据,并为其添加一个字符串。这是我的代码:将pandas导入pd import numpy as np df = pd ....

回答 1 投票 1

有效地将Pandas数据帧写入Google BigQuery

我正在尝试使用此处记录的pandas.DataFrame.to_gbq()函数将pandas.DataFrame上传到google大查询。问题是to_gbq()在直接上传到...时需要2.3分钟

回答 1 投票 9

如何为pandas数据框中的多个非现有列分配值?

所以我想要做的是将列添加到数据帧并用单个值填充它们(分别为所有行)。导入pandas为pd import numpy as np df = pd.DataFrame(np.array([[1,2],[3,4]]),...

回答 2 投票 4

如何通过pandas get_dummies()方法为某些列创建虚拟对象?

df = pd.DataFrame({'A':['x','y','x'],'B':['z','u','z'],'C':['1 ','2','3'],'D':['j','l','j']})我只想要A列和D列来获取假人而不是列...

回答 3 投票 9

pandas fillna:如何从系列开始直到第一个值出现才填充领先的NaN?

我有几个pd.Series通常从一些NaN值开始,直到出现第一个实际值。我想用0填充这些领先的NaN,但不是在系列后面出现的任何NaN。 PD ....

回答 1 投票 2

将DataFrame的行索引保持在Variance Threshold转换

我在pandas DataFrame上使用sklearn进行方差阈值特征选择。为了避免特征选择产生偏差 - VarianceThreshold只是第一步 - 我已将...划分了......

回答 1 投票 1

排序后,pandas merge_asof键必须排序错误

我想将一个目标列从一个数据框合并到另一个数据框。合并的数据框具有更多的键,它们很接近,但与原始数据帧不完全匹配。看一个例子......

回答 1 投票 3

比较表以创建存在/不存在矩阵填充空而不包含小数

命令行:文件可以在git-hub找到。 File1:https://raw.githubusercontent.com/felipelira/files_to_test/master/file1.txt File2:https://raw.githubusercontent.com/felipelira/files_to_test / ...

回答 1 投票 1

尝试命名多个索引获取密钥错误

早上好,我正在使用python 3.6。我正在尝试命名我的索引(请参阅下面的代码中的最后一行),因为我打算加入另一个DataFrame。 DataFrame应该是多索引的。该指数是......

回答 1 投票 1

Pandas中的随机数据块

我需要从我的数据帧df中获取随机数据块。我尝试过使用df.sample(10),但它只生成单个样本,而不是连续的块。有没有办法随机抽样......

回答 2 投票 0

融合数据框中的多个列

假设我有以下数据框:我想要的是将数据框处理为以下形式:我尝试了pd.melt函数但不幸的是它只是在多列中做得很差...

回答 1 投票 1

使用seaborn保留工作日在熊猫箱图上订购[复制]

我有一个简单的数据集,上面有几天:dt,value,coltype 2017-01-01,10,A 2017-01-02,11,B 2017-01-03,30,A 2017-01-04,90, C 2017-01-05,9,A 2017-01-06,13,E 2017-01-07,12,C 2017-01-08,...

回答 1 投票 0

Pandas根据列值将数据帧拆分为多个csv

我有一个与此问题非常类似的问题,但我需要通过将分割数据帧保存到csv来更进一步。导入pandas为pd import numpy as np import os df = pd.DataFrame({'CITY':np ....

回答 1 投票 2

Python pandas str.extract regex字符串结尾

data.Hotel_Address.head(10)0 s Gravesandestraat 55 East 1092 AA Amsterdam ... 1 s Gravesandestraat 55 East 1092 AA Amsterdam ... 2 s Gravesandestraat 55 East 1092 AA Amsterdam ... 3 ...

回答 1 投票 0

pandas将日期转换为周数

我试图将日期转换为星期时出现此错误可能是日期值不是像日期时间一样的值吗? data ['DATE CREATED']。dt.week错误截图

回答 1 投票 2

在Python中填充具有滞后值的数据帧

我试图编写一个循环,用上一年的值填充数据框或矩阵中的元素。这些列代表了50年内不同的年份。行代表......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.