dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何在Scala Spark的where子句中使用UDF

我正在尝试检查数据帧中的2个双列是否相等到一定程度的精度,因此49.999999应该等于50.是否可以创建UDF并在where子句中使用它?我在用 ...

回答 2 投票 1

数据帧成密集矢量火花

我正在研究spark 2.0.2我想知道,例如,基于Spark ML进行逻辑回归。我希望将数据帧的每一行都放到一个将被输入的向量中...

回答 2 投票 1

如果其他列相等,则生成列

我有两个数据帧:df1

回答 1 投票 0

标准化数据框中的测量单位

考虑我有以下数据帧d = {'数量':[100,910,500,50,5.5,22.5,1300,600,20],'uom':['KG','GM','KG', 'KG','GM','MT','GM','GM','MT']} df = pd.DataFrame(data = d)df My ...

回答 2 投票 0

用于DataType转换的udf函数,Scala

我有下一个DataFrame:df.show()+ --------------- + ---- + | X | NUM | + --------------- + ---- + | [0.1,0.2,0.3] | 0 | | [0.3,0.1,0.1] | 1 | | [0.2,0.1,0.2] | 2 | + --------------- + ---- + ...

回答 1 投票 0

将值逐行写入数据帧太慢

我有这样的数据帧:df1 = Customer |项目|数量---------------------- 001 | A | 3 001 | B | 3 002 | C | 4 002 | D | 8 ... | ...... | ......我......

回答 1 投票 0

在R中的数据帧中逐行SUMIFS

新海报,但长期读者。我遇到了一个问题,我没有在R中找到解决方案。基本上有条件的sumif来自两个数据帧。每个数据帧都有多个XID和日期。什么 ...

回答 1 投票 0

合并仅包含一个重复列的两个数据集

我试图合并两个数据集,如V1 Berry作为第一个数据集和V4 V6 V7 V1 Temp Temp Temp Temp使V4 V6 V7 V1温度温度温度NA NA NA Berry I ...

回答 1 投票 0

检查另一个数据集中是否存在列名

所以我有两个不同的数据集,我试图检查列名是否在另一个数据集中有一个重复的列名。例如:V1 V2 V3 1 2 3作为一个数据集和V4 V6 ......

回答 2 投票 0

根据优先级列表生成新列

拥有如下优先级列表:Google:高优先级Yahoo:中等优先级Microsoft:来自二进制数据帧的低优先级,如下所示:> df

回答 2 投票 1

按计数对R中的表进行排序

我在R中创建了一个函数来创建一个提供计数和百分比的表:tblFun

回答 3 投票 1

如何将阈值应用于pandas DataFrame列并输出超出阈值的行?

我有一个大型的产品系列数据集。我试图捕捉任何价格过高/低于其他家庭成员的奇怪数据条目。例如,我有一个这个pandas.DataFrame:...

回答 3 投票 4

将pandas Dataframe转换为float

我无法将我的数据框中的数据类型转换为从字符串浮动(它们是数值作为字符串或空字符串):calcMeanPrice_df = dessertApples_df.iloc [:,5:17] #slice of columns for ...

回答 1 投票 1

Python:嵌套列表合并,在同一索引中添加int

我只想添加两个列表,如下所示。我不必使用嵌套列表,但可以将其更改为numpy数组。请告诉我。谢谢!输入lst1 = [[1,0,1],[1,0,0],[0,1,0]] lst2 = [[0,1,...

回答 8 投票 1

Python Pandas合并(和连接)是否无法通过sufffix参数重命名列?

我通过键列顺序合并一些数据帧,但我发现没有使用suffix参数重命名列。我使用的是Python 3.5和Panadas 0.19.2。进口......

回答 3 投票 1

如何使用.agg方法计算pandas中的列平均值

我明白.agg可以很容易地用于计算平均值。例如,如果我有一个数据帧df:df one two three A 1 2 3 B 4 5 6 C 7 8 9 ...

回答 1 投票 3

Sum dataframe列前一行和两列的乘积

我有一个包含3列的数据框。日期关闭pos_chg cash 2000-01-04 81.9375 0.0 10000.00 2000-01-05 69.7500 0.0 0.00 2000-01-06 65.5625 0.0 0.00 2000-01 -...

回答 1 投票 1

df [“速度”]和df $速度之间的差异

假设数据帧df具有列速度,那么访问列的方式有什么不同:df [“speed”]或者像这样:df $ speed下面正确计算平均值:...

回答 2 投票 1

应用嵌套在la中不在R中工作

就在今天早些时候,我收到了一个非常有用的答案,我遇到了一个问题,这让我可以进入我的一个项目的下一步。但是,我后来再次陷入困境......

回答 1 投票 0

从计数列创建饼图,百分比作为标签

我创建了一个列表,其中包含1列的值:ataques_tot

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.