dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

row.name使用`structure`函数作为c(NA,* integer *)

有没有人知道为什么我运行它:row.names(结构(列表(速度= c(4,7),dist = c(2,22)),row.names = c(NA,2L),class =“ data.frame“))我明白了:#”1“”2“而不是c(...

回答 1 投票 2

在Spark Dataframe中的列列表中添加一列rowums

我有一个包含多个列的Spark数据帧。我想在数据帧上添加一列,它是一定数量的列的总和。例如,我的数据如下所示:ID var1 var2 var3 ...

回答 4 投票 16

检查panda数据帧中的多个列是否重合并在新列中标记它们

我有两个数据帧,其中一些行是相同的。我要做的是检查任何行在另一个数据帧的3列中是否具有相同的3个值,向列I添加特定标签...

回答 1 投票 0

如何在dataframe python中找到不是时间戳的数据?

这是时间戳列:TIME 2018-03-02 11:57:37 2018-03-12 10:36:16 2018-03-29 12:02:21 2018-03-23 16:37:08 2018-03 -09 22:22:28 。我尝试合并并面临以下问题......

回答 2 投票 1

如何计算Python Pandas中两列之间的日期差异[重复]

我正在尝试使用以下代码查找两个日期列之间的日期差异。但是,我没有得到预期的结果。我是初学者。例如开始日期是2016-02-18 00:00:00,结束日期是......

回答 1 投票 0

将最后一个有效索引替换为特定值

我正在研究一个有一个热编码列的数据框。为简单起见,让我们说它看起来像这样:a b 0 1 NaN 1 1 1 2 1 NaN 3 NaN 1我想替换最后一个......

回答 2 投票 1

将值添加到数据框和导出

我试图在数据框中添加两个值作为列表,一个是句子,另一个是我得到的单词列表,在现在对这些句子进行标记化之后,我已经完成了以下代码...

回答 1 投票 2

具有时间偏移熊猫的滚动平均值

我有一个pandas中的时间戳和值的数据集。时间戳之间的间隔在大约一年的总时间跨度内是~12秒,但有时会有缺失点(即时间......

回答 1 投票 0

修改pandas dataframe列中的字符串

我想将所有字符串设置为小写,并删除字符串开头和结尾的空格。 df = pandas.DataFrame(data = [1,2,3,'A'],columns = ['A'])df ['A'] = numpy.where(df ['A'] ....

回答 1 投票 0

尝试合并2个数据帧但得到ValueError

这些是我的两个数据框保存在两个变量中:> print(df.head())> club_name tr_jan tr_dec年0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 1477 ...

回答 1 投票 27

Pandas加入(合并?)数据帧,只保留唯一的指标

我有一个带日期索引的数据框。有几个日期不知何故失踪了。我将调用数据帧A.我有另一个数据框,其中包含相关日期。我会称之为......

回答 3 投票 1

Pandas:按行数将数据帧拆分为多个数据帧

对熊猫来说还是新手所以请耐心等待...我有一个巨大的csv,有很多行的表。我想简单地将每个数据帧拆分为2,如果它包含超过10行。如果是真的,我想......

回答 8 投票 24

使用列表/数据帧作为R中for循环中的项

我很确定这是基本的东西,但我无法通过谷歌搜索找到答案。所以我的问题是:我想在列表或数据框列表中使用for循环。但是当你使用list [i]时,你会得到所有......

回答 1 投票 2

pivot_table()到df没有要聚合的数字类型

我有一个df,我试图去反规范化。基本上我想将参数值,例如'inst-cap-c','cap-lo-c'等更改为列。为了做到这一点,迄今为止有两种方法......

回答 1 投票 1

使用r自动选择.csv文件中的行和列

所以我为我的论文创建了一个数据库,我想比较不同情况下的物质来获得P值。为了做到这一点,我在R中创建了一个脚本,而不是......

回答 1 投票 0

将特定信息添加到pandas变形的特定列中

我有两个pandas变量:df1:空DataFrame列:[time_tweet,time_stock,sentiment,trend]索引:[] df2:index like ... user_screen_name情绪...

回答 1 投票 -1

绘图使用ggplot2绘制数据帧列表

我的目标是使用ggplot2绘制几个数据帧(它们都具有相同的结构)。我需要读取一个csv文件,所以我得到一个数据帧然后我拆分它给了我一个列表与我的数据帧。 ...

回答 2 投票 1

关于Google Big Query中数据框中的DateTime与DateTime的问题

我正在尝试将数据从数据框推送到Google Big Query。我将数据框的日期字段设置为df ['time'] = df ['time']。astype('datetime64 [ns]')并将Google的Big Query日期设置为* ...

回答 1 投票 0

蟒蛇。在Pandas数据帧中使用Lambda函数的IF条件

df = pd.read_csv('data / eurusd_dukascopy.csv')df.columns = ['timestamp','open','high','low','close','volume'] df ['oc'] = df.close - df.open df ['uptail'] = df ['oc']。apply(lambda x:(df.high - df ....

回答 2 投票 0

Pandas-Dataframe:如何计算变量在1分钟内重复的次数

我有以下数据帧片段:完整数据帧:ip time cik crawler ts 2019-03-11 00:00:01 71.155 ....

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.