dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

csv行开头和结尾的额外逗号,如何删除?

所以我有一个.csv文件,每行看起来像这样:11:00:14,4,5。,93.7,0.01,0.0,7,20,0.001,10,49.3,0.01 ,, 11:00:15 ,4,5。,94.7,0.04,0.5,7,20,0.005,10,49.5,0.04,它应该是这样的:11:......

回答 4 投票 1

用于MLP的列车中的Scikit使用列表

我想用以下数据训练神经网络(Multi-Perceptron):1 2 3其他字段标签[1,2,3,4] [5,6,7,8] [9,10,11] 1234。 ..

回答 1 投票 1

重命名列中的向量

我有一个数据框,总结如下:CEMETERY SEX CONTEXT RaHD.L RaHD.R 1 Medieval-St。 Mary Graces FEMALE 7172 21.2 21.6 2 ...

回答 2 投票 1

如何在数组或数据框中保存Julia for循环返回?

我试图在代码显示的DataFrame的每一行上应用一个函数。使用RDatasets iris = dataset(“datasets”,“iris”)函数mean_n_var(x)mean1 = mean([x [1],x [2],x [3],x [4]])...

回答 1 投票 3

将列表值设置为DataDrama中的列

所以我绊倒了这个问题,几个小时都找不到解决方案。基本上我有以下两个列表,我希望将其转换为我的最终解决方案:数据框,其日期为...

回答 1 投票 1

使用u'和Decimal值解码字符串中的Python json

我需要解码并加载到DB,这是一个以下列格式到达的字符串:“[{u'date':1508760000000,u'value':0},{u'date':1509364800000,u'value':十进制('5.989999771118164')},{u'date':...

回答 2 投票 1

如果列值重复,则根据多个条件保留行,否则保持行

我想将数据表子集化,以根据日期和其他两列(id和类型变量)的条件值包含记录。但是,如果每个id只存在一条记录,则无论如何......

回答 3 投票 1

如何将字符串冒号分隔列转换为MapType?

我试图将Dataframe转换为RDD,以便将地图(带键值对)分解为不同的行。 Info = sqlContext.read.format(“csv”)。 \ option(“分隔符”,“\ t”)。 \ option(“标题”,“...

回答 1 投票 3

在groupby函数之后从数据帧获取信息

我试图获得特定列中的最大值。之后,我是具有所有属性的相应行值。我怎样才能做到这一点? SYM NUM DATE A 3 23 A 4 5 B 6 14 B ...

回答 1 投票 0

我可以为igraph中的根/终端顶点之间的edgelist属性创建单独的数据框吗? (R)

这是我正在处理的数据的头部:motherinst inst time dist speed 2 20080713_235233_es_0_JWC 20080714_163628_es_0_XKK 0.6971644 1.4921751 2 ....

回答 1 投票 0

根据另一个R中的共享项筛选一列中的项目

我有一个表,每个样本都有一个唯一的标识符,但也有一个节标识符。我想提取每个部分的所有与所有距离比较 (这些数据来自第二个表格),例如......

回答 2 投票 0

数据帧必须是pandas中显示输出的最后一个命令吗?

因为我必须显示输出的数据帧并执行文件处理和错误记录。所以我在pycharm中创建了.ipynb文件并完成了上面提到的所有内容?但是我可以在外面的窗口看到数据帧...

回答 2 投票 0

R:如何用不同的标题和/或数据帧的溢出部分连接数据帧的部分,续

我有一个程序的输出,就像这样。 Keg tar tar jar jar EA_A EA_D EA_E EA_G 123F 0 1 0 0 0 0 0 0 134E 0 0 0 0 0 ...

回答 1 投票 0

用闪亮的应用程序在.csv中编写flatten data.frame

我在管理我的Shiny应用程序中创建的动态data.frame时遇到问题。问题是,因为它是通过server.R处理的,我找不到访问它的方法,将其展平为向量然后写...

回答 1 投票 1

合并其中一个中包含间隔数据的两个数据帧[重复]

作为输入,我有两个数据帧:data1 = [{'code':100},{'code':120},{'code':110}] data1 = pd.DataFrame(data1)code 0 100 1 120 2 110 data2 = [{'category':1,'l_bound':99,'r_bound':105} ...

回答 1 投票 6

如何简化合并数据帧的过程?

我有几个包含列的数据框:coupon_id和rating。我想合并这些数据帧,并获得一个数据帧,所有coupon_id和评级为所有评级为此coupon_id的总和...

回答 1 投票 3

将每个id和law(带有开始和结束年份)的行的数据框转换为每个id和year有一行的文件

我有一个名为法律的法律,每个法律都有一行(每个id一个):法律

回答 4 投票 4

遇到错误,将data.frame强制转换为数值

我在这里有一个名为“matched_SNPs”的data.frame:SNP ACB ASW BEB EFF rs10007883 0.536458333333333 0.549180327868853 0.191860465116279 -0.005748 ...

回答 2 投票 1

当有两个索引,pandas,python时,绘制日期时间

我有下面显示的数据框,美元州日期AL 01/01 10 01/08 15。 。 。 12/30 8 AK 01/01 10 ...

回答 1 投票 1

在电子邮件正文中发送包含DataFrames作为表格的电子邮件

我创建了几个DataFrames,并希望将它们添加到我发送的电子邮件正文中。我是否需要将每个DataFrame转换为html然后将html转换为表格?这是我的最后一步......

回答 1 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.