dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

我想根据字母和数字将列拆分为5个不同的列

我的数据表中有一列我需要分成5列。典型值是1A02B1,我需要将其分成1,A,02,B,1列。

回答 2 投票 -1

如何从第一列作为参考的数据框中创建列表?

我还在学习R.我想知道如何使用第一列作为参考来创建列的列表。以mtcars为例:head(mtcars)mpg cyl disp hp drat wt ...

回答 1 投票 0

在密钥上加入Spark数据帧

我构建了两个数据帧。我们如何加入多个Spark数据帧?例如:PersonDf,ProfileDf,其公共列为personId(key)。现在我们怎样才能拥有一个Dataframe ......

回答 5 投票 32

如何计算两个日期/时间之间的实例数

Noobie在这里,所以请耐心等待。我会尝试尽可能简洁。我有两个数据帧:df2:由每个人的唯一访问号码,到达我们商店的时间,...

回答 1 投票 1

如何将Dataframe转换为List(Scala)?

我想将包含Double值的Dataframe转换为List,以便我可以使用它来进行计算。您的建议是什么,以便我可以采取正确的类型列表(即双倍)?我......

回答 3 投票 0

将时间序列从CSV加载到DataFrame中

是否可以从CSV中创建Daru DataFrame,其中第一列是一系列日期?取以下CSV,例如:time,min,max 2018-01-01,101,103 2018-01-02,102,105 2018-01 -...

回答 1 投票 0

如何将dataframe中的列与空列匹配

我需要映射数据框中列之间的值。我的数据框中的值类型是列表。这是我的数据帧的例子:date tablenameFrom tablenameJoin ...

回答 2 投票 1

Pandas Concat添加空单元格/列

我有两个像这样的pandas数据帧。标题是指示性的 - 数据帧实际上没有任何标题(标题)。 ** Dataframe 1 ** Browser_name计算IE ...

回答 3 投票 1

如何比较数据帧中的两列并返回相应的记录,如果找到匹配?

我想匹配来自2个数据帧的字符串,如果匹配,则返回相应的结果。所以我的第一个数据帧包含:名称abc pqr xyz第二个数据帧包含Id Name 1 abc 2 ...

回答 1 投票 -1

删除特定csv文件中的前导0

我有一个名为new.csv的csv文件我试图删除某个名为code的列中的所有前导0。 ID,名称,代码 0,凯文,010 1,约翰,011 2,卡西,020 ...

回答 5 投票 1

python pandas dataframe head()什么也没显示

我是新手使用熊猫,我只是不知道该怎么做:我正在使用python。我(正确)安装了anaconda。在我的文件中,我只是创建一个DataFrame(首先从...导入它)

回答 2 投票 4

根据列表dplyr添加列

我试图总结一个数据帧列表。这是一些测试数据noms

回答 1 投票 1

在SQLContext之外用Java创建SparkSQL UDF

问题我想在Java中创建一个用户定义函数,可以在Apache Spark运算符链中作为Java方法调用。我找不到那些没有的Java示例...

回答 1 投票 3

用于访问列表或数据框元素的方括号[]和双括号[[]]之间的区别

R提供了两种不同的方法来访问列表或data.frame- []和[[]]运算符的元素。两者有什么区别?在什么情况下我应该使用一个...

回答 12 投票 461

根据列中的一组参数将数据帧拆分为多个数据帧

我有一个这样的数据帧:DF ID A B C 00 X0 Y0 PARAMETER_0 01 X1 Y1 PARAMETER_1 02 X2 Y2 PARAMETER_2 03 X3 Y3 ...

回答 2 投票 2

如何在Pyspark中将一列10百万条记录转换为20000条记录的列?

正如您在图像中看到的那样,我们有一个数据框,其中一列包含1000万个值。我们的目的是重塑这个数据框,并获得一个在列中划分1000万个值的数据框...

回答 1 投票 -4

Pandas - 将数据帧转换为特定格式

我有一个Dataframe有两列如下:col_a,col_b 10,32 23,43 32,64我试图将Dataframe转换为以下格式:[(10,32),(23,43),( 32,64)]

回答 1 投票 0

如何在单列中创建两种不同的日期格式?

我有一栏我不明白如何,但在一列中有两种不同的格式。 df ['Date'] = [6/24 / 2019,6 / 14 / 2019,2019-09-06 00:00:00,6 / 14 / 2019,6 / 14/2019]我想进一步处理.. 。

回答 3 投票 1

R:基于现有数据帧的多个条件创建新数据帧

我需要在现有数据帧上使用多个条件创建新的数据帧。我尝试使用dplyr函数,特别是对于多个条件进行汇总但是因为数据集大小而失败...

回答 1 投票 1


最新问题
© www.soinside.com 2019 - 2024. All rights reserved.