dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何将numpy fillna()与numpy.where()一起用于pandas DataFrame中的列?

这是一个示例pandas DataFrame:导入pandas为pd import numpy as np dict1 = {'file':['filename2','filename2','filename3','filename4','filename4','filename3'],'amount ':[3,4,......

回答 1 投票 1

使用groupby和head(有条件地)过滤DataFrame

我想使用pandas groupby和有条件的头来过滤这个数据帧。这是一个示例DataFrame:df = pd.DataFrame([['是',2],['是',4],['是',6],['不',8],['不', 5],...

回答 1 投票 0

将数据帧中的NaT替换为先前的变量

如何从数据框中替换之前创建(设置)的日期/变量的NaT?我得到以下数据帧:日期名称CF 0 NaT彼得-10 ...

回答 1 投票 2

编写检查所有pandas DataFrame列值是否满足某个值?

我正在为软件包编写支票。 pandas DataFrame中的元素满足某些条件;如果他们不这样做,我将提出在Python中编写的ValueError异常。这是......

回答 1 投票 1

pandas DataFrame总和

假设我有一个带有数字列的数据框,A,B,C,D。我使用pandas dataframe sum来汇总这些列。它返回一个像这样的系列A 9237 B 965 C 5109 D ......

回答 1 投票 0

过滤Pandas Dataframe

我有这个pandas数据帧:打开高低收盘量TimeStamp 2016-06-23 10:00:00 586.76 594.00 585.54 ...

回答 1 投票 2

回答 1 投票 4

无需循环即可高效创建数据帧

我正在处理一些广告数据,例如电子邮件数据。我有两个数据集:一个在邮件级别,每个人的数据集,说明他们邮寄的日期,然后他们是哪一天...

回答 1 投票 1

如何设计一个r函数,从列表列表中选择特定元素,并返回一个数据帧作为输出

我正在尝试设置一个r函数,它将从列表中选择相关元素,最后以数据帧作为输出。这是我正在使用的列表:test_list

回答 1 投票 0

计算数据帧pandas中唯一行的数量

我需要计算数据帧熊猫中唯一行的数量。我尝试这个解决方案:pandas - 数据帧中出现的唯一行数,但它会产生错误。这是我尝试的代码:...

回答 2 投票 1

如何使用pandas从word文档(.docx)文件中的表创建数据框

我有一个带有数据表的word文件(.docx),我正在尝试使用该表创建一个pandas数据框,我使用了docx和pandas模块。但我无法创建数据框。来自docx import ...

回答 1 投票 2

检查列中所有值的几个条件

我刚开始使用python和pandas。我搜索谷歌和堆栈溢出来回答我的问题,但一直无法找到。这就是我需要做的事情:我有一个...

回答 1 投票 2

Python OLS模型:__ init __()缺少1个必需的位置参数:'endog'

导入statsmodels.api为sm xdat = rets ['EUROSTOXX'] xdat = sm.add_constant(xdat)ydat = rets ['VSTOXX'] model = sm.OLS(y = ydat,x = xdat).fit()我不知道不明白为什么会弹出一个错误...

回答 1 投票 4

多指数与一系列指数

我有一个约100k行的数据帧df,格式为: - ID,日期,计数1,11-12-2017,23 1,12-12-2017,21 2,11-12-2017,13 2,12 -12-2017,28 3,11-12-2017,22 3,12-12-2017,23在此,我......

回答 1 投票 0

将数组作为Spark SQL中的UDF参数传递

我试图通过一个以数组作为参数的函数来转换数据帧。我的代码看起来像这样:def getCategory(categories:Array [String],input:String):String = {...

回答 1 投票 8

有条件地替换数据帧列中的字符串的一部分

如果我在列中没有特定的分隔符/字符串,我想替换一个字符串。如果该行中已存在分隔符,则我不想触摸该行。我有大约350万条记录。 ...

回答 4 投票 3

Python Dataframe:将多索引列与单索引列组合/替换

我的df中有多索引列。在我的df中,所有值都是1或0表示布尔值。我的任务是用我的另一个df_test数据帧中的值替换值为'1'的值。见下文。在[221]中:......

回答 2 投票 0

根据data.table中其他列中的计算值计算列中的滚动总和

我试图从另一列的计算值计算列中的值。 DT

回答 1 投票 1

在Pandas中,.iloc方法是否提供副本或视图?

我发现结果有点随机。有时它是副本有时它是一个视图。例如:df = pd.DataFrame([{'name':'Marry','age':21},{'name':'John','age':24}],index = ['student1', 'STUDENT2' ...

回答 2 投票 12

熊猫:替代iterrow循环

我有一个小函数我在pandas中运行,当我在y语句中运行if x时抛出一个ValueError。我看到类似的问题推荐布尔索引,.isin()和where(),但我......

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.