dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何计算Python Pandas中两列之间的日期差异[重复]

我正在尝试使用以下代码查找两个日期列之间的日期差异。但是,我没有得到预期的结果。我是初学者。例如开始日期是2016-02-18 00:00:00,结束日期是......

回答 1 投票 0

将最后一个有效索引替换为特定值

我正在研究一个有一个热编码列的数据框。为简单起见,让我们说它看起来像这样:a b 0 1 NaN 1 1 1 2 1 NaN 3 NaN 1我想替换最后一个......

回答 2 投票 1

将值添加到数据框和导出

我试图在数据框中添加两个值作为列表,一个是句子,另一个是我得到的单词列表,在现在对这些句子进行标记化之后,我已经完成了以下代码...

回答 1 投票 2

具有时间偏移熊猫的滚动平均值

我有一个pandas中的时间戳和值的数据集。时间戳之间的间隔在大约一年的总时间跨度内是~12秒,但有时会有缺失点(即时间......

回答 1 投票 0

修改pandas dataframe列中的字符串

我想将所有字符串设置为小写,并删除字符串开头和结尾的空格。 df = pandas.DataFrame(data = [1,2,3,'A'],columns = ['A'])df ['A'] = numpy.where(df ['A'] ....

回答 1 投票 0

尝试合并2个数据帧但得到ValueError

这些是我的两个数据框保存在两个变量中:> print(df.head())> club_name tr_jan tr_dec年0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 1477 ...

回答 1 投票 27

Pandas加入(合并?)数据帧,只保留唯一的指标

我有一个带日期索引的数据框。有几个日期不知何故失踪了。我将调用数据帧A.我有另一个数据框,其中包含相关日期。我会称之为......

回答 3 投票 1

Pandas:按行数将数据帧拆分为多个数据帧

对熊猫来说还是新手所以请耐心等待...我有一个巨大的csv,有很多行的表。我想简单地将每个数据帧拆分为2,如果它包含超过10行。如果是真的,我想......

回答 8 投票 24

使用列表/数据帧作为R中for循环中的项

我很确定这是基本的东西,但我无法通过谷歌搜索找到答案。所以我的问题是:我想在列表或数据框列表中使用for循环。但是当你使用list [i]时,你会得到所有......

回答 1 投票 2

pivot_table()到df没有要聚合的数字类型

我有一个df,我试图去反规范化。基本上我想将参数值,例如'inst-cap-c','cap-lo-c'等更改为列。为了做到这一点,迄今为止有两种方法......

回答 1 投票 1

使用r自动选择.csv文件中的行和列

所以我为我的论文创建了一个数据库,我想比较不同情况下的物质来获得P值。为了做到这一点,我在R中创建了一个脚本,而不是......

回答 1 投票 0

将特定信息添加到pandas变形的特定列中

我有两个pandas变量:df1:空DataFrame列:[time_tweet,time_stock,sentiment,trend]索引:[] df2:index like ... user_screen_name情绪...

回答 1 投票 -1

绘图使用ggplot2绘制数据帧列表

我的目标是使用ggplot2绘制几个数据帧(它们都具有相同的结构)。我需要读取一个csv文件,所以我得到一个数据帧然后我拆分它给了我一个列表与我的数据帧。 ...

回答 2 投票 1

关于Google Big Query中数据框中的DateTime与DateTime的问题

我正在尝试将数据从数据框推送到Google Big Query。我将数据框的日期字段设置为df ['time'] = df ['time']。astype('datetime64 [ns]')并将Google的Big Query日期设置为* ...

回答 1 投票 0

蟒蛇。在Pandas数据帧中使用Lambda函数的IF条件

df = pd.read_csv('data / eurusd_dukascopy.csv')df.columns = ['timestamp','open','high','low','close','volume'] df ['oc'] = df.close - df.open df ['uptail'] = df ['oc']。apply(lambda x:(df.high - df ....

回答 2 投票 0

Pandas-Dataframe:如何计算变量在1分钟内重复的次数

我有以下数据帧片段:完整数据帧:ip time cik crawler ts 2019-03-11 00:00:01 71.155 ....

回答 1 投票 2

用于大型交叉连接的Spark scala分区数据框

我有两个需要在20节点集群上交叉连接的数据帧。但是由于它们的大小,简单的交叉连接失败了。我期待分区数据并执行交叉连接和...

回答 2 投票 0

如果存在与数据中的某些条件匹配的另一行,则从pandas DataFrame中查找行

例如,如果我有如下DF:n从km到0 B 300 A 1 A 300 B 2 D 290 A 3 B 310 C 4 A 290 D我想......

回答 2 投票 1

如何在pandas数据帧中反转.astype(str)?

我不得不删除数据框中包含列表值的重复行。所以我使用了pd_data ['douban_info_string'] = pd_data ['douban_info']。astype(str)其中'douban_info_string'有列表...

回答 3 投票 3

使用列值筛选行作为另一个数据集的条件

这非常棘手。假设我有一个第一个数据集df:样本ID名称1 ID200,ID300,ID299前2个ID2,ID123秒3 ID90 ......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.