数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。
在for循环中使用pandas.DataFrame.at()
pandas DataFrame我开始:pandas DataFrame我正在尝试构建:我对计算机科学非常陌生,所以我不太确定如何在不提供图像的情况下提出问题。基本上,我想......
如何将数据帧中的多个值(与1个与多个其他变量相关联)转换为优雅的单个行?
数据:名称real_name类型a A AA aa A AA a- A AA b B BB bbb B BB ...通缉结果:名称real_name类型{a,aa,a-} A ...
我有一个数据表,看起来像这个价值代码ABCD GFHTI时间......
我有数据集与gamesessions的数据(id,会话数,会话的持续时间和每个id的会话日期)这里mydat的样本:mydat = read.csv(“C:/Users/Admin/desktop/rty.csv “,sep =”;“,......
我有以下格式的输入数据集输入数据格式输入数据由以下代码片段生成。 for i in range(0,10):my_list = df1.iloc [i] .split(“,”)...
我试图访问index01的数据帧的下一行:ex:df.ix [index01]的下一行?谢谢
我有一个数据框,有两列链接和值。 Link列的值为“abcd.com/efgh/ijkl/mnop”,是一个URL。这个框架中有10,000行,我从...的样本中取出
使用函数返回新的Dataframe(通过转换现有的Dataframe) - spark / scala
我是Spark的新手。我试图将JSONArray读入Dataframe并对其执行一些转换。我试图通过删除一些HTML标签和一些换行符来清理我的数据。为......
R - 将三个数据帧的列表合并为第一列中具有ID的单个数据帧,接下来的三列显示值[重复]
这是我的数据帧列表:[[1]] ID值A 1 B 1 C 1 [[2]] ID值A 1 D 1 E 1 [[3]] ID值B 1 C 1我在一个单一之后在...中具有唯一(非冗余)ID的数据帧
我有一个以相同方式构建的多个数据框列表。我想将每个数据框的1列的名称更改为数据框本身的名称,并附加一些文本。来自......
Python Pandas - 基于字符串中的子字符串进行合并
我有2个数据帧,格式如下:df_search SEARCH part1 anotherpart onemorepart df_all FILE EXTENSION PATH part1_1 .prt // server / folder1 / part1_1 part1_2 ...
我有以下df,我想合并具有相同ID的线,除非有重复的Ids A B C D E F G H I J 4411 24 2 55 26 1 ...
我有一个数据帧:v1 v2 v3 c1 a 1.593979 1.679763 1.613202 n 1.327004 2.551197 1.492442 z 1.615528 1.156273 1.817987我想创建一个...
Pandas dataframe threshold - 如果超过,则保持数字固定
从第1天到第7天,我有一个三人(约翰,特里,亨利)得分的数据帧.1 2 3 4 5 6 7约翰1.3 2.8 3.0 4.4 2.6 3.1 4.8特里1.1 ......
我有两个数据帧,我试图结合,但我没有得到我想要使用pandas.concat的结果。我有一个数据库,我想添加新数据,但只有名称列...
我正在使用Pyspark DataFrame。我想更新Age列中的NA值,其值为14到46之间的随机值。我该怎么办?
我正在开发一个动态脚本,可以加入任何给定的pyspark数据帧。问题是文件中的列名称会有所不同,连接条件的数量可能会有所不同。我可以循环处理这个......