dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

计算R(每行)中一组变量中值的出现次数 - 使用权重

我有以下df8数据帧:df8 = data.frame(V1 = c(10,20,10,20),V2 = c(20,30,20,30),V3 = c(20,10,20,10) ))以下是每行的值出现次数:a

回答 1 投票 1

Python Pandas Pivot表 - 计数点

我在Python中有一个Pivot表的问题。假设我在列表中有以下值:team_A_id = [1,5,10] team_A_result = 0及以下数据框:id points 3 36 4 ...

回答 2 投票 0

Pandas Dataframe - 根据变量添加新行

我有一个程序可以对大量数据进行排序,并提取一堆必要的值并将它们保存为数字或字符串。然后,我如何将这些值放入新的数据框?为......

回答 2 投票 0

Pandas数据帧 - 如果他的任何行包含特定值,则选择所有用户的行

我有一个包含患者,日期,药物和诊断的数据框。每位患者都有一个独特的身份('pid'),可能会或可能不会用不同的药物治疗。选择所有的最佳做法是什么...

回答 4 投票 1

R - 将来自多个数据集的ID设置为数据框(到多个文件中)

设G是我的“主数据框”,包含多个列,包括“id”。设S [i]是仅包含1列=“id”的多个文件。 G和S [i]中的“id”是相同的。我想创建H [i]这是...

回答 2 投票 1

pandas dataframe删除低频行

删除具有低频率列的所有行的最佳做法是什么?数据帧:IN:foo bar poo 1 a A 2 a A 3 a B 4 b B 5 b A 6 b A 7 c C 8 d B 9 ...

回答 2 投票 2

从另一个数据帧子切片初始化新数据帧及其列名

X = dataset.iloc [:,2:-1] .values df_X = pd.DataFrame(X)df_X.head()我将列切片到数组中指定的索引。有没有什么办法可以在切片之后显示列名...

回答 2 投票 1

r-使用sf将线串分割为多线串

我试图在数据帧中以“LINESTRING”sf格式分割2行,在另一个数据帧中使用“MULTIPOLYGON”sf格式的2个圆圈。 #使用sf点lndf创建数据框

回答 1 投票 2

R:按列平滑df值

我有一个df,我想变成折线图。如下所示,图表有很多峰值,所以我决定我应该平滑每个变量的值。有没有办法取代每个细胞...

回答 1 投票 0

Pandas Dataframe,当列不相等时加入两个dt

假设我有两个数据表,相同的形状,比如N行和2列。它们具有相同的列名“One”,“Two”调用第一个表“left”,然后调用第二个表“right”。我该怎么回新...

回答 1 投票 1

python如何将数据传输到数据帧,如u'** \ t ** \ r ** \ t ** \ r'

我有一些这样的数据,u'1 \ t \ u80a1 \ u7968 \ r2 \ t \ u503a \ u5238 \ r3 \ tTOT- \ u6211 \ u53f8 \ u5355 \ u4e2a \ u4fe1 \ u6258 \ u8 \ u812 \ u \ t \ u408 \ u708 \ u7 u900f \ u5f0f \ uff09 \ R4 \ tTOT- \ u6211 \ u53f8 \ u591a \ u4e2a \ u4fe1 \ u6258 \ ...

回答 2 投票 0

基于行索引拆分数据框

我想通过循环遍历行和子集index =(diff(Data $ Time> 1800))来分割我的数据帧(i in 1:length(indices)){if(indices [i] == TRUE){## ###我需要一个函数来分割数据......

回答 1 投票 1

具有2个标准的Python Dataframe Vlookup

我有一个具有多个日期/时间/价格的数据框,但是喜欢在每天1600提取价格以创建一个新列(Priceat1600)。 (因此它需要Vlookup在1600年的日期和时间)...

回答 2 投票 1

合并具有不同级别的两个Dataframe并将一级分层行索引移动到列

我有两个我要合并的数据帧:第一个:在:数组= [['RMP1','RMP1','RMP1','Coop','Coop','Coop','RMP2','RMP2' ,'RMP2'],['1。瓦拉日丁, '5.Vipap','11。布尔诺”, '1.Varazdin',...

回答 1 投票 1

计算R中多列中的字符值

我有一个数据框,就像这样:团队成员

回答 2 投票 1

python - 来自2个groupby列的聚合计数的最大值

我想从列名称和小时数的行数中获取最大值:导入pandas为pd小时= [8,8,9,9,8,9,10,10,8,9,12,12,10 ,11,12,12]姓名= ['A','B','......

回答 3 投票 0

转换CassandraTableScanRDD org.apache.spark.rdd.RDD

我有以下情况。我有大型Cassandra表(有大量列),我想用Spark处理。我只想将选定的列加载到Spark中(应用选择...

回答 1 投票 1

想要用Python替换某些值的列

使用的代码:def fn(x):for x in x:x = x.replace('Wood','Wooden')return x test ['Coming:'] = test ['Column:']。apply(fn)样本输出:列:即将来临:需要:木...

回答 2 投票 0

每天计算实例pandas数据帧

我有一个数据帧df = pd.DataFrame(data = [[1,0],[1,0],[2,0],[2,1]],columns = ['day','class'])我想每天计算一级的实例。我用这种方式使用groupby,df.groupby(['...

回答 3 投票 0

将列添加到Multiindex Dataframe

我想在下面的df1中添加一个列SUM。它是一个Datetime MultiIndex,新列SUM应该返回价格行的总和。 multex = pd.MultiIndex.from_product([['price','weight','...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.