dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

Python DF:如何根据条件为一行选择多列中的值?

这里我有一个数据集,其中包含一个记录的几个代码。我需要选择以'6'开头的代码并将它们放入每个记录的新列中。 Dataframe如下所示:ID Code1 ......

回答 1 投票 0

R问题:shapiro.test函数在dplyr :: summarize中不起作用,而其他汇总函数也是如此

当我尝试在我的R DataFrame上使用shapiro.test作为汇总函数时,我得到错误:df%>%summarize_all(shapiro.test)错误:列“A”必须是长度1(汇总值),而不是4这里是我的......

回答 2 投票 0

哪种方法可以在两个不同的excel-files / dataframes中检查具有相同键值的多行值?

我有两个excel文件。两者都包含有关相同数据对象的信息。数据对象由str类型的对象编号(列ON)标识。例子:表1 ......

回答 1 投票 0

获取每次两个值匹配的总和

我的googleing让我失望,我认为我的主要问题是我不确定如何表达这个问题(抱歉这个糟糕的标题)。我试图找到每次2人以同样方式投票的总数。在你下面......

回答 2 投票 3

检查Pyspark Dataframe中的重复项

有没有一种简单有效的方法来检查python数据帧只是为了重复(而不是删除它们)基于列?我想检查一个数据框是否有基于列和...的组合的重复...

回答 1 投票 1

如何分组列名和连接

我有一张excel表给我看起来像这样的更长:原始版本我必须将它导入Access,它绝对需要格式如下:Desired Version So ...

回答 1 投票 1

pd.to_datetime没有以正确的格式生成[重复]

我有数据集:日期Max_Temp Min_Temp 0 01-01-11 27.0 14.2 1 02-01-11 26.4 15.8 2 03-01-11 27.8 15.4 3 04-01-11 26.4 13.6 4 05-01-11 26.4 15.6 5 .. 。

回答 1 投票 -1

如何在R中运行嵌套for循环以从DOMO导入数据表?

我有两个代表Domo中数据表的列表,我使用Domo API来检索。 ID是domo中数据表的id。我会使用DomoR :: fetch()函数来获取...

回答 2 投票 1

如何有效地从大型excel文件中读取数据,进行计算,然后将结果存储回python中?

让我们说我有一个100k行的excel文件。我的代码试图逐行读取它,并为每一行进行计算(包括执行每一行所需时间的基准)。然后,我的代码......

回答 2 投票 0

r比较两个数据帧之间的列类型

这可能是一个糟糕的问题,因为我没有发布任何可重复的示例。我的主要目标是在两个具有相同列名的数据帧之间识别不同类型的列。 ...

回答 5 投票 1

在各种数据帧中比较R中的列名

我目前正在尝试比较R中各种数据帧的列类和名称,然后再进行任何转换和计算。我的代码如下所示:: library(dplyr)m1&...

回答 2 投票 2

如何比较两个数据框是否具有相同的列名和类?

我想比较两个数据帧并检查它们是否具有相同的列集,是否有任何内置函数或R中的任何库?这些数据框的值可能不同,但数据都是......

回答 2 投票 2

在df.groupby()中表达所需操作的pandanic方法.agg()[复制]

这个问题可能与pandas无关,但是当一个函数作为另一个函数中的参数传递时,python如何处理,我不确定。无论如何,请注意以下意图......

回答 1 投票 0

describe()返回“ERROR:UndefVarError:describe not defined”

我将SQL数据库中的表导入到数据帧中,现在我试图通过describe()获取有关数据帧的统计信息。我也试过head()。两者都返回错误“错误:UndefVarError:...

回答 1 投票 0

将一个变量与R中的组的其他变量进行比较

我有以下数据框:data.frame(id = c(“a”,“a”,“a”,“d”,“d”),value = c(5,46,12,14,32) ,low = c(46,8,NA,0,34),high = c(56,20,NA,12,60))...

回答 3 投票 0

找到每个索引的每个列的第一个非空出现的最佳方法是什么?

我有一个如下所示的数据框:ItemID属性CostGrade RelatedTo ------------------------------------- -------- 01A tya 01A van 01A 03a ...

回答 2 投票 1

从另一个数据帧的行值中提取数据帧中的特定行值[重复]

我有一个这样的数据框(df1):X Y 1 200.0 50 2 200.1 57 3 200.2 69 4 200.3 77 5 200.5 84 6 ...

回答 1 投票 0

Python Pandas KeyError:'标签不在[index]中

我有一个索引的duplicates_to_fetch数据框:mail_domaine值0 @ A.com [0,2] 1 @ B.com [1,4]以及以下......

回答 3 投票 1

从列表或dict创建Pandas DataFrame始终返回空DF

我正在尝试用字典创建一个pandas数据帧。字典键是字符串,值是1个或更多列表。我有一个奇怪的问题,其中pd.DataFrame()命令一致...

回答 6 投票 2

OSError:在Pandas中的csv上从文件初始化失败

我已经查看了这个问题上的所有类似帖子,但找不到任何解决方案......到目前为止,Pandas读完了我的所有CSV文件没有任何问题,但是现在似乎有问题.. ...

回答 9 投票 18

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.