pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何根据行索引和列名称在两个数据帧之间复用多个值?

我讨厌tapabramase:tb1 1 Google apple soma ibin kaus date 2009-01-14 your last nan 01-01 2009-01-21 nan-150 nan tb2i 2 iGoogle apple ...

回答 2 投票 1

熊猫重命名索引

我有以下数据框,我想将索引从summary重命名为id:summary student count 0 error 6 1是1 2 no 1 3其他9我有......

回答 3 投票 1

列出大熊猫中大相关矩阵的最高相关对?

如何在Pandas的相关矩阵中找到最高相关性?关于如何使用R执行此操作有很多答案(将相关性显示为有序列表,而不是作为大型矩阵或高效方式...

回答 7 投票 49

python上的reverse_geocoder与熊猫

我目前正在使用此代码通过一个文件并获取该区域,但是由于我有118185行数据需要执行,因此需要永久执行。还有其他方法可以使用......

回答 1 投票 1

Pandas-Dataframe:如何计算变量在1分钟内重复的次数

我有以下数据帧片段:完整数据帧:ip time cik crawler ts 2019-03-11 00:00:01 71.155 ....

回答 1 投票 2

拆分python中不同列中列内的字典列表

我有一个像这样的数据框= {'col_1':[1,2],'col_2':[[{'KEY':'A','VALUE':'a'}],[{'KEY': 'B','VALUE':'b'}]],'col_3':[[{'KEY':'C','VALUE':'c'}],[{'KEY':'A', ” ...

回答 3 投票 1

熊猫表名[重复]

我在pandas中创建了一个小数据帧,如下所示:df = pd.DataFrame({'weather':[16,22,32,8,2]})输出中的df给了我一张表:weather 0 16 1 22 2 32 3 8 4 2我......

回答 2 投票 0

警告! *** HDF5库版本不匹配错误*** python pandas windows

我正在使用pandas / python以HDFStore格式保存DataFrame。当我应用my_data_frame.to_hdf(arguments ...)命令时,我收到一条错误消息:警告! *** HDF5库版本不匹配错误* ...

回答 2 投票 5

如何计算所有特征与目标变量(二元分类器,python 3)的相关性?

我想在python中计算我所有特征(所有浮点类型)和类标签(二进制,0或1)的相关性。另外,我想绘制数据以通过...来显示它们的分布。

回答 1 投票 2

比较列表列

如何将列B列表值与列A列表值进行比较,并保留列B列表值或在列A值的列表元素为NaN时将其更改为NaN?我试图搜索它,但......

回答 2 投票 1

gspread(在熊猫中阅读谷歌表)[关闭]

我是python编程的新手。我需要在python中读取一个google工作表,以便我可以使用python(pandas)操作工作表。我们怎么办?

回答 1 投票 1

如果存在与数据中的某些条件匹配的另一行,则从pandas DataFrame中查找行

例如,如果我有如下DF:n从km到0 B 300 A 1 A 300 B 2 D 290 A 3 B 310 C 4 A 290 D我想......

回答 2 投票 1

如何在pandas数据帧中反转.astype(str)?

我不得不删除数据框中包含列表值的重复行。所以我使用了pd_data ['douban_info_string'] = pd_data ['douban_info']。astype(str)其中'douban_info_string'有列表...

回答 3 投票 3

Pandas替换多列的值

如果匹配值等于sample_input,则替换sample_input中的值。现在使用的合并方法可以匹配,但不知道如何替换它。 ......中有许多重复值

回答 1 投票 0

使用glob.glob时从重复轴错误重新索引

当我尝试运行此代码时:将pandas导入为pd import glob文件= [pd.read_excel(p,skipfooter = 1)for p in glob.glob(“path / * .xlsx”)] df = files [0]。追加([files [i] for i in range(1,len(files))])...

回答 1 投票 1

将具有不同权重的DataFrame列相乘

我需要通过权重将数据帧中的各列相乘。所以我有以下代码df.C1 * = 0.2 df.C2 * = 0.01有没有更好或更短的方法,可能是权重列表......

回答 1 投票 0

访问真正大型csv文件有哪些不同的方法?

我一直在做一个项目,我必须尽快读取和处理数百万行的非常大的csv文件。我看到了链接:https://nelsonslog.wordpress.com/2015/02/26 / ...

回答 2 投票 0

Python Pandas融化稀疏数据框架

我有一个看起来像这样的数据框a b z 1 NULL NULL ... 1 2 NULL 1 ... NULL 3 1 NULL ... NULL第一列总是填充,右边还有很多其他的...

回答 2 投票 0

重命名Pandas DataFrame索引

我有一个没有标题的csv文件,带有DateTime索引。我想重命名索引和列名,但是使用df.rename()只重命名列名。错误?我的版本是0.12.0 In [2]:df = pd ....

回答 7 投票 98

并排输出两个Pandas数据帧的差异 - 突出显示差异

我试图突出显示两个数据帧之间的确切变化。假设我有两个Python Pandas数据帧:“StudentRoster Jan-1”:id Name score isEnrolled ...

回答 11 投票 113

© www.soinside.com 2019 - 2024. All rights reserved.