pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

获取pandas中每列的差异

我想计算列车和测试文件中保存的特征的方差a:col1 Feature0 Feature1 Feature2 Feature3 Feature4 Feature5 Feature6 Feature7 Feature8 ...

回答 1 投票 0

删除pandas中2个特定列之间的空值

我有以下时间序列数据帧。我想用之前的值填充缺失的值。但是我只想填充first_valid_index和...之间的缺失值。

回答 2 投票 3

多指数与一系列指数

我有一个约100k行的数据帧df,格式为: - ID,日期,计数1,11-12-2017,23 1,12-12-2017,21 2,11-12-2017,13 2,12 -12-2017,28 3,11-12-2017,22 3,12-12-2017,23在此,我......

回答 1 投票 0

Python与模糊,熊猫

我有两个csv,其中行可以与一列中的值匹配(在对此列进行一些调整之后)。在匹配之后我想从它们中取出一些值并创建一个新的,...

回答 1 投票 0

有条件地替换数据帧列中的字符串的一部分

如果我在列中没有特定的分隔符/字符串,我想替换一个字符串。如果该行中已存在分隔符,则我不想触摸该行。我有大约350万条记录。 ...

回答 4 投票 3

创建用于汇总另一列的最后x次出现的列

我正在尝试创建一个新列,我们称之为“HomeForm”,即“HomeTeam”列中每个条目的“FTHG”的最后5个值的总和。对于0队来说,想法是......

回答 1 投票 1

Python Dataframe:将多索引列与单索引列组合/替换

我的df中有多索引列。在我的df中,所有值都是1或0表示布尔值。我的任务是用我的另一个df_test数据帧中的值替换值为'1'的值。见下文。在[221]中:......

回答 2 投票 0

在某些情况下无法将系列附加到数据帧

我是一个新手熊猫用户,并为一些麻烦感到沮丧。情况就是这样。这是最初的数据帧。在[9]中:df Out [9]:重要性区间last_read last_update名称...

回答 2 投票 0

我有一个csv由于额外的逗号而中断,我只需要数据集中的一列但它出现在带有额外逗号的列之后

如果我可以反向解析csv,无论错误如何都能得到正确的值。 df1 = pd.read_csv('MyData.csv',error_bad_lines = False)我能够看到...之前的所有列

回答 2 投票 -1

将Pandas DataFrame中的行与每列的最大值对齐

在每个列的特定条件下对齐Pandas DataFrame的行的最有效方法是什么,例如最大值?这是我的例子,我在找到后手动移动列...

回答 1 投票 1

如何在pandas DataFrame中转换或解码Unicode字符?

我正在使用pandas从excel文件中读取一些数据并进行了一些行遍历以生成一个python字典,然后将其放入json文件中。问题是我得到了Unicode字符......

回答 1 投票 1

在Pandas中,.iloc方法是否提供副本或视图?

我发现结果有点随机。有时它是副本有时它是一个视图。例如:df = pd.DataFrame([{'name':'Marry','age':21},{'name':'John','age':24}],index = ['student1', 'STUDENT2' ...

回答 2 投票 12

熊猫:替代iterrow循环

我有一个小函数我在pandas中运行,当我在y语句中运行if x时抛出一个ValueError。我看到类似的问题推荐布尔索引,.isin()和where(),但我......

回答 3 投票 2

在aws中使用时出现pd.read_json错误

我是aws和json文件的新手。我试图在aws中的一个实例中读取一个json文件,代码为:pd.read_json('train.json')但是我收到了ValueError消息:ValueError:Unexpected ......

回答 1 投票 0

为了使用groupby和qcut,Pandas会丢弃唯一的行

我如何放弃独特?它干扰了groupby和qcut。 df0 = psql.read_frame(sql_query,conn)df = df0.sort(['industry','C'],ascending = [False,True])这是我的数据帧:id ...

回答 1 投票 2

仅使用一级索引设置多索引数据框的值

我的问题是这个主题的合理延续:在pandas中使用multiindex设置值。所以这个例子和答案也适合我的情况。他们用f.loc设置了一个多索引值[(...

回答 1 投票 2

Element Wise对具有pandas数据帧的字符进行逻辑运算

我正在处理一个数据框,其中每个条目都是来自A-E的字符,代表不同的强度等级。例如:数据帧df = 1 2 3 0 C C A 1 0 D B ......

回答 2 投票 1

如何在窗口小部件中使用pandas.plot()的matplotlib图?

到目前为止,我有这个代码:当它执行时,你会看到两个windows main和另一个叫做图1,当csv数据被加入时,按下了绘图按钮,图形显示在另一个...

回答 1 投票 0

Pandas根据条件重命名所有连续的行

我有类似的数据框:您可以使用以下代码重新创建它:将pandas导入为pd df = pd.DataFrame({'A':1。,'name':pd.Categorical([“hello”,“hello”, “你好你好”]), '...

回答 1 投票 0

熊猫地图创建NaNs

我的意图是更换标签。我发现了使用字典并将其映射到数据帧。为此,我首先提取了必要的字段并创建了一个字典,然后我将其输入...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.