dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

在Python数据帧连接中动态填充列名

我正在开发一个动态脚本,可以加入任何给定的pyspark数据帧。问题是文件中的列名称会有所不同,连接条件的数量可能会有所不同。我可以循环处理这个......

回答 1 投票 0

Python:迭代每个DataFrame组的最快方法

我有一个数据帧,可以分成多个组,执行功能,然后将组重新组合为一个数据帧。问题是......中的独特元素数量

回答 3 投票 0

R中保留的CSV订单

我的数据顺序很重要。如果我使用read.csv将CSV加载到R中,那么数据帧中行的顺序是否保证与CSV的顺序相匹配?如果我加载一堆CSV和rbind怎么样...

回答 3 投票 8

如何只打印Category列[没有其他列]?

我想访问给定数据框中的类别但无法获取它。 “如何只打印类别列?”此代码显示计数中只有一列,但我也想访问类别...

回答 1 投票 -1

Pythons逐行应用数据

当函数有其他参数时,我不明白在创建函数时应该如何使用“行”。我想创建一个函数来计算我的数据帧“文件”的新列。 ...

回答 3 投票 1

填充DataFrame MultiIndex级别1中的间隙,每个级别0的填充方式不同

我有一个MultiIndex DataFrame,其级别为1的gappy日期值,如下所示:np.random.seed(456)j = [(a,b)表示b的['A','B','C'] in random.sample(pd.date_range('2018-01-01',句点= 100,freq = ...

回答 1 投票 0

R - 有条件地创建多个变量(因子百分比)

R版本3.4.2我试图根据基于同一数据帧的其他变量的条件创建3个新变量。我设法实现了我的目标,但它需要几行......

回答 2 投票 0

在迭代数据帧时,“序列的真值是模糊的”错误

我试图在名为active_positions的数据框中“Todays Price”列高于“Target Price”列的条件下添加列表“quantity”。我尝试了以下代码:...

回答 1 投票 0

按列表中的列表或向量重复数据帧列

我有一个df(数据帧):df = data.frame(V1 = c(10,20,10,20),V2 = c(20,30,20,30),V3 = c(20,10,20, 10))> df V1 V2 V3 1 10 20 20 2 20 30 10 3 10 20 20 4 20 30 10我有一个向量v

回答 2 投票 0

计算R(每行)中一组变量中值的出现次数 - 使用权重

我有以下df8数据帧:df8 = data.frame(V1 = c(10,20,10,20),V2 = c(20,30,20,30),V3 = c(20,10,20,10) ))以下是每行的值出现次数:a

回答 1 投票 1

Python Pandas Pivot表 - 计数点

我在Python中有一个Pivot表的问题。假设我在列表中有以下值:team_A_id = [1,5,10] team_A_result = 0及以下数据框:id points 3 36 4 ...

回答 2 投票 0

Pandas Dataframe - 根据变量添加新行

我有一个程序可以对大量数据进行排序,并提取一堆必要的值并将它们保存为数字或字符串。然后,我如何将这些值放入新的数据框?为......

回答 2 投票 0

Pandas数据帧 - 如果他的任何行包含特定值,则选择所有用户的行

我有一个包含患者,日期,药物和诊断的数据框。每位患者都有一个独特的身份('pid'),可能会或可能不会用不同的药物治疗。选择所有的最佳做法是什么...

回答 4 投票 1

R - 将来自多个数据集的ID设置为数据框(到多个文件中)

设G是我的“主数据框”,包含多个列,包括“id”。设S [i]是仅包含1列=“id”的多个文件。 G和S [i]中的“id”是相同的。我想创建H [i]这是...

回答 2 投票 1

pandas dataframe删除低频行

删除具有低频率列的所有行的最佳做法是什么?数据帧:IN:foo bar poo 1 a A 2 a A 3 a B 4 b B 5 b A 6 b A 7 c C 8 d B 9 ...

回答 2 投票 2

从另一个数据帧子切片初始化新数据帧及其列名

X = dataset.iloc [:,2:-1] .values df_X = pd.DataFrame(X)df_X.head()我将列切片到数组中指定的索引。有没有什么办法可以在切片之后显示列名...

回答 2 投票 1

r-使用sf将线串分割为多线串

我试图在数据帧中以“LINESTRING”sf格式分割2行,在另一个数据帧中使用“MULTIPOLYGON”sf格式的2个圆圈。 #使用sf点lndf创建数据框

回答 1 投票 2

R:按列平滑df值

我有一个df,我想变成折线图。如下所示,图表有很多峰值,所以我决定我应该平滑每个变量的值。有没有办法取代每个细胞...

回答 1 投票 0

Pandas Dataframe,当列不相等时加入两个dt

假设我有两个数据表,相同的形状,比如N行和2列。它们具有相同的列名“One”,“Two”调用第一个表“left”,然后调用第二个表“right”。我该怎么回新...

回答 1 投票 1

python如何将数据传输到数据帧,如u'** \ t ** \ r ** \ t ** \ r'

我有一些这样的数据,u'1 \ t \ u80a1 \ u7968 \ r2 \ t \ u503a \ u5238 \ r3 \ tTOT- \ u6211 \ u53f8 \ u5355 \ u4e2a \ u4fe1 \ u6258 \ u8 \ u812 \ u \ t \ u408 \ u708 \ u7 u900f \ u5f0f \ uff09 \ R4 \ tTOT- \ u6211 \ u53f8 \ u591a \ u4e2a \ u4fe1 \ u6258 \ ...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.