dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

我如何将帧数据更改为时间序列?

我每天的降雨量数据为36年。我想分析时间序列,但我的数据仍然是帧数据的形式,我如何将帧数据更改为时间序列。我的数据是变量,如何......

回答 1 投票 -2

Python Pandas - 迭代唯一的列

我试图迭代一个独特的列值列表,以创建三个不同的键与字典中的字典。这是我现在的代码:将pandas导入为pd dataDict = {} ...

回答 1 投票 0

pyspark使用数据帧运行线性回归

我尝试在pyspark中使用数据框运行线性回归,但是在我尝试使用函数来创建字段,标签之后,它仍然给我一个错误。有人可以帮我弄清楚如何运行线性...

回答 1 投票 0

分组数据帧然后在pandas中过滤的最有效方法

下午全部,我有一个非常大的数据集,我已经分组。下面是一个示例:df_ccy = df.groupby(['currency_str','state'['state']。count()。reset_index(name ='count')。sort_values(['count'],...

回答 1 投票 1

dataframe我可以正确提取列表中的纯值吗?

我目前是一名Python自学成才的初学者。对于索引,行在df_price.iterrows()中:prod_weight = prod_weight = prod_data.loc [prod_data ['sku'] == row ['sku']] ['weight'] ....

回答 1 投票 -1

将命名列添加到R中的数据框[重复]

我正在重新格式化一些数据框,并想知道是否有更有效的方法将命名列添加到数据框,而不是下面的:colnames(df)

回答 3 投票 1

在Python“html5lib not found”中将html读取到数据框时出错

在尝试读取html数据框时,我遇到了关于html5lib的以下错误。这是代码:!pip install html5lib!pip install lxml!pip install beautifulSoup4 import html5lib ...

回答 1 投票 1

Scala / Spark数据帧数组

[我们正在测试一种在优化时可提供出色并行性的驱动程序。诀窍是,它没有在Spark分区内并行化(在访问DB2中),所以要求是我们告诉它......

回答 1 投票 1

如果在间隔中,则数据帧中的值为零

我仍然是R的新手,我试图将数据帧中的值设置为零,如果它们在区间IR e {-0,5:0,5}中,则数据框如下所示:var1 var2 var3 1 -0.2 1.0 0.7 2 0.2 -0.5 ......

回答 2 投票 1

PySpark数据框显示错误的值

我刚刚从Pandas切换到PySpark数据框,发现在PySpark数据框中打印出相同的列会产生错误的值。这是一个例子:使用熊猫:df_pandas = pd.read_csv(“犯罪......

回答 1 投票 0

Python 3.4 - Pandas - 帮助正确排列数据帧列和删除无效列

这个问题基于Python - Pandas - 根据我之前提到过的分类值,将多列的行组合成数据帧中的单行。我在下面有一张桌子......

回答 1 投票 2

如何根据一个数据帧中的列值和R中另一个数据帧的列标题名称有条件地创建新列

我有一个数据帧df1,它有一个名为averageDate的列,其中包含日期,格式为%Y-%m。我有另一个数据帧df2,其中大多数列名称是...中的日期值

回答 2 投票 2

Pandas DataFrame.add() - 忽略缺少的列

我有以下两个DataFrames:>>>上面的历史asn国家12345 US 5 4 MX 6 3 54321 MX 4 5 >>>当前......

回答 3 投票 6

计算出多个行子集的平均值

我有一个csv文件,其中包含每个省的商店销售数据,包括商店ID。我已经想出如何获得销售额最多的省份列表,以及带有...的商店列表

回答 1 投票 0

按时间阈值过滤行

我有一个这样组织的数据集:ID Species DateTime P1 A 2015-03-16 18:42:00 P2 A 2015-03-16 19:34:00 P3 A 2015-03-16 19:58:00 P4 A。 ..

回答 4 投票 0

从R中的数据框中提取具有相同标题的变量

我有一个庞大的数据集。这是一个例子:Ac.1

回答 2 投票 2

使用字符串识别R中的列名序列

我目前正在尝试使用预定义的字符串来识别R中的多个列名。为了更明确,我使用ave函数为子组创建标识变量...

回答 2 投票 0

Pandas:从不完整的布尔系列更新DataFrame

我有两个DataFrames:>>> df1以上last_below asn country 12345 MX 6 3 1002000 US 5 4 1006000 54321 MX 4 5 1004000>&...

回答 1 投票 0

基于Pandas.Dataframe中的多个列合并多个重复行

我需要根据Dataframe中的多个列来识别重复的行。剩余的列(PKID - 具有整数值)应合并为整数列表。示例:输入数据:(行0和...

回答 1 投票 1

在data.frame中显示重复记录并省略单个记录

我一直在努力如何在R中仅选择重复的data.frame行。对于实例,我的data.frame是:age = 18:29 height = c(76.1,77,78.1,78.2,78.8,79.7,79.9, 81.1,81.2,81.8,82.8,83.5)姓名= ......

回答 4 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.