dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

在Pandas中使用.map从字典创建列时,省略大括号

我不确定我的标题是否足够清晰,但我有以下问题:我想使用.map从我的数据框中的字典创建一个新列。这是按预期工作,除了一个......

回答 3 投票 1

将Pandas数据框列值合并到新列中

我正在和Pandas一起工作,我有一个数据框,我们可以在其中填充三个值中的一个:ID_1 ID_2 ID_3 abc NaN NaN NaN def NaN NaN NaN ghi NaN NaN jkl ...

回答 3 投票 12

在三个DataFrame中查找复合键的存在,并相应地连接DataFrame

这个问题很难说。以下是一个可重复示例的示例代码:将numpy导入为np导入pandas为pd df1 = pd.DataFrame([['a',1,10,1],['a' ,2,20,1],['b',1,...

回答 1 投票 1

Dataframe Spark 2.2.1上的可调用列对象

在Spark版本2.2.1中相当于此调用的是什么:df.column_name.eqNullSafe(df2.column_2)(df.column_name不可调用。它在2.3.0中工作但在2.2.1中我得到错误:TypeError :'...

回答 1 投票 1

加入来自不同季节/年的两个数据集,与体育有关(例如,NHL,1991和1992年季节)

在一定年限内,我有NHL团队的数据集。我想知道加入这些数据集的最佳方法。例如,我有芝加哥黑鹰队的统计数据,从1991年和1992年开始,玩游戏(...

回答 1 投票 0

如何建立自动划分列值?

我有一些具有不同ncol的数据帧。我想用来自第二列的特定规则替换该值,此列中的值应该是原始值除以...

回答 1 投票 2

仅对pandas dataframe中的某些列名进行字符串操作

我在数据帧ID c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 ... cN中有列名,但我希望它看起来像ID c01 c02 c03 c04 c05 c06 c07 c08 c09 c10 c11 c12 ... cN怎么能我只改变......

回答 1 投票 0

匹配R中的值[重复]

说,我有数据集mydat =结构(列表(x1 =结构(c(2L,3L,4L,5L,1L),. Label = c(“”,“a”,“b”,“c”,“d) “),class =”factor“),x2 =结构(1:5,.Label = c(”a“,”b“,”c“,”d“,”e“),class = ...

回答 1 投票 0

连接数据框中的列

我有一个大的csv文件,我已经过滤掉了我想要的行,并创建了更小的更易于管理的数据帧(称为“CL”)。 Int64中的每一行都有合约月和合约年(我...

回答 1 投票 2

计算xarray数据集中两个变量的外积

我想在xarray.Dataset中沿共享维度计算两个变量的外积。具体来说:假设我有一个以下形式的xarray数据集:import numpy as np ...

回答 1 投票 0

使用月份差价重新格式化数据框,并按R中的日历顺序排序[重复]

我有一个data.frame给出如下。我试图将它从长格式转移到宽格式。使用传播列为日期。使用来自tidyr包的传播功能提出了两个问题:...

回答 3 投票 5

pandas multiindex将标签添加到索引级别

我有一个带有multiindex的pandas数据帧如下:TALLY DAY NODE CLASS 2018-02-04 pdk2r08o005 3 7.0 2018-02-05 pdk2r08o005 ...

回答 1 投票 0

按列名称变量选择数据框列

假设我有一个如下所示的数据框:dframe = data.frame(x = c(1,2,3),y = c(4,5,6))并且假设我想自适应地抓住另一个列,这样,对于dframe的每一行,我......

回答 2 投票 3

当匹配所有数字时,r for循环

我有一个数据框,每行有7个数字,我想做一个for或while循环告诉我,当一行是一行时。数据框:1st 1st 3rd 4th 5th 6th 7th 1 5 32 34 ...

回答 2 投票 0

如何重新排列R中的单个细胞?

Col1 Col2 Col3 Row1粉红玫瑰红苹果蓝笼Row2粉红玫瑰红苹果蓝笼Row3粉红玫瑰蓝笼红苹果Row4粉红玫瑰红......

回答 1 投票 0

通过在一列中添加不同的数据从一个创建两个数据帧

我是python的新手,并且正在努力解决一个非常基本的概念,所以请耐心等待。请接受我的道歉。 Objetive:我有一个现有的数据帧,我想采用现有的数据帧并创建两个......

回答 2 投票 1

如何融合/改变数据帧?

我知道有很多问题专门询问熔化或改变数据帧,但经过一些研究后我找不到任何与我的问题直接相关的问题。每个月,我们......

回答 2 投票 0

python更改行的列

我只看到了与我在这里寻找的相反的帖子。使用jupyter notebooks / python我从csv文件导入了第一个块,我想要第二个块:Country | ...

回答 2 投票 0

根据条件替换R数据帧中的值[重复]

在R中,我使用带有if语句的for循环来替换数据帧中超出特定范围的所有值。 for(i in seq_along(df $ Age)){if(df $ Age [[i]]> 90 || df $ Age [[i]]

回答 1 投票 0

使r忽略值在列中出现的顺序(通过粘贴多列创建)

给定变量x可以取值A,B,C,D和变量x的三列:df1

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.