dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何从文件夹中的多个csv文件创建一个数据框

我有一个CSV文件列表(A1.csv,A2.csv ........ D10.csv)在一个文件夹中,其中包含两列但多行的数据。基本上,我想从所有...中提取最后一行和第二列的值

回答 4 投票 0

将另一个数据框合并到现有行

我有2个数据帧df和subs:df = pd.DataFrame({“scode”:[11,22,33,44],“sname”:[“aa”,“bb”,“cc”,“dd” ],“sub1”:[“伦敦”,np.nan,“德里”,np.nan],“sub2”:[np.nan,np.nan,“Sydney”,...

回答 2 投票 0

计算不同时间段内子组的数据框中的百分比变化

有一些类似的问题,但我没有遇到一个有助于我的具体情况;每个季度都会记录每个活动名称的活动数量,有几个通行证......

回答 1 投票 0

Pandas-在保留列/索引值的同时向DataFrame添加缺少日期?

我有一个熊猫数据框,其中包含日期,客户,商品以及购买的美元价值。日期客户产品amt 1/1/2017 tim apple 3 1/1/2017 ...

回答 4 投票 1

在R中查找并按列标题和ID替换

我在解释时遇到了问题,但是我正在尝试解决这个问题:对于每个受访者,我想用Open1和Open2列中的值替换Open1和Open2。我觉得这......

回答 3 投票 0

如何从DataFrame中的命名列级别选择值的子集?

假设我们有一个具有多级列标题的DataFrame。 level_0 A B C level_1 P P P ...

回答 2 投票 8

我的R代码将宽数据帧转换为长格式有什么问题?

我在Rstudio中运行以下R代码,目的是将宽数据帧(称为“合并”)转换为长数据帧。 >合并1月2月3月4月5月6月7月8月9月10月11月...

回答 2 投票 0

如何将列中的所有数据移动到单个列(不合并),然后拆分为R中的新列?

我使用Excel创建了一个数据噩梦来进行项目数据输入。我有两个电子表格,总共有20个标签。每个选项卡中的数据结构相同。我设法创建了一个CSV ...

回答 1 投票 1

与熊猫的迭代比较

我不知道要解决这个问题。我有一个看起来像这样的数据框cuenta_bancaria nombre_empresa perfil_cobranza usuario_id usuario_web 5545 a 123 ...

回答 2 投票 0

为什么pandas数据框将所有数据解释为NaN?

我正在从csv文件导入数据以用于pandas数据框。我的数据文件有102行和5列,并且所有这些文件在Excel中都清楚地标记为“数字”。我的代码如下:import ...

回答 2 投票 0

按组对data.frame执行基于矢量的操作

我已经看到一些相似的问题在这里得到解答,但是,我的大脑在实现将我直接阅读的内容应用到我的数据方面遇到了一些麻烦。我想减去包含的向量...

回答 1 投票 2

将具有N个类别的分类因子重新编码为N个二进制列

原始数据框:v1 =样本(字母[1:3],10,替换= TRUE)v2 =样本(字母[1:3],10,替换= TRUE)df = data.frame(v1,v2)df v1 v2 1 bc 2 aa 3 cc 4 ba 5 cc 6 cb ...

回答 6 投票 16

Panda连续多个时间序列,分组和扩展缺失的数据

我有从CSV文件导入的多个时间序列数据。这些数据都有时间戳,但时间戳并不总是匹配:时间序列1:UUT数据日期时间......

回答 1 投票 1

使用相似和不相交的列连接DataFrame

为简化讨论,简化了问题。取3个具有相似和不相交列的数据帧,但列值相同。如何以一种没有重复的方式将它们连接起来......

回答 1 投票 1

将列表中的所有矩阵转换为R中的data.frames

我在R. library(nlme)fm2中输出了lme函数

回答 1 投票 6

R:将字符转换为R data.frame中的数字

关于这个数据提取的问题我做了。我想创建一个带有数据的条形图但不幸的是我无法将提取的字符转换为R内的数字。如果我编辑...

回答 1 投票 0

在数据框中搜索值,然后将字典中的相应值放入新的coloumn中

我有一个数据框,其中有一列名称。我有另一个字典,其名称为键和与之关联的值。我想在数据框中搜索名称并添加相应的值...

回答 1 投票 0

试图在数据帧中删除NaN索引行

我正在使用python 2.7.3和Pandas版本0.12.0。我想删除带有NaN索引的行,以便我只有有效的site_id值。 print df.head()special_name site_id NaN ...

回答 6 投票 17

从拆分索引获得的分组值

我需要找到最多两列(p_1_logreg,p_2_logreg),其中比较应该仅限于14行。我的csv文件我试图将索引切成:int1_str1_str2_int2_str3_int4 ...

回答 1 投票 1

将“TimeStamp”列截断为pandas`DataFrame`中的小时精度

我有一个名为df的pandas.DataFrame,它有一个自动生成的索引,列dt:df ['dt']。dtype,df ['dt'] [0]#(dtype('

回答 2 投票 26

© www.soinside.com 2019 - 2024. All rights reserved.