dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

R:将行与公共信息组合在一起

我有这样的数据框:V1 V2 V3 V4 V5 V6 V7 V8 V9 1。 mRNA 1300 9000。 +。 ID = mRNA00003; Parent = gene00001; Name = EDEN.3 1。外显子1300 1500。 +。 ID = exon00001; ...

回答 2 投票 0

将因子级别更改为列的自定义顺序

我有一个如下数据框> data = data.frame(name = c('Mike','Tony','Carol','Tim','Joe'),veh = c('car','bike' ,'汽车','汽车','循环'))>数据名称veh 1迈克汽车2托尼...

回答 2 投票 1

如何将pandas DataFrame与内置逻辑连接起来?

我有两个pandas数据帧,我想产生预期数据框中显示的输出。导入pandas为pd df1 = pd.DataFrame({'a':['aaa','bbb','ccc','ddd'],'b'......

回答 3 投票 3

使用多个值来制作Python Pandas表

使用我的代码,我可以在1中加入两个Excel数据库。问题是它只向我显示了“收入”列而不是列展示次数。为了更清楚,我留下了代码和示例。我试过了 ...

回答 1 投票 3

执行pct_change()只考虑多个ID的时间序列数据帧中的前一年?

我有一个示例数据帧“df:df = pd.DataFrame({'Year':[2000,2002,2003,2004] + [1998,1999,2003,2004],'Name':['A'] * 4 + ['B'] * 4,'价值':[4,1,1,......

回答 1 投票 1

当我迭代地重复使用旧的缓存数据时,Spark Dataframe突然变得非常慢

当我尝试将缓存结果保存在List中并尝试通过每次迭代中最后一个列表中的所有数据计算新DataFrame时,问题就发生了。但是,即使我使用空的DataFrame和......

回答 2 投票 1

执行只考虑时间序列数据帧中前一年的pct_change()?

我有一个示例数据框“df”:df = pd.DataFrame({'Year':[2000,2002,2003,2004],'Name':['A'] * 4,'Value':[4,1 ,1,3]})当我执行pct_change()时我....

回答 1 投票 0

将列表中的元素连接到R中新列中的特定格式

我有latlon坐标和相关的“subID”。我想在此数据框中创建一个新列,其中每个子ID都已粘贴为html格式。见下文:我的数据:latlon ......

回答 2 投票 1

选择数据帧中的下一行,以便在R中插入数据

我有一个数据框,例如:名字年龄1“丹尼”20 2“米特”35 3“迪伦”8当我得到新的条目时,我想更新这个df。我在下一行使用了nrow(df)+ 1:df [nrow(df)+ 1,...

回答 2 投票 3

使用dplyr将一个数据框的NAME列重命名为R中的另一个数据框的列NAME [复制]

我有两个数据帧,我存储为ca13和ca0112。我想使用合并函数按列名合并这两个数据帧。但是,列名称不同。我正在尝试使用...

回答 2 投票 -1

在数据框中查找包含NA的列的行?

我有一个包含67列的转换表,我得到67列的输入。我的目标是检查我是否可以在此转换表中找到它。要清楚,67列构建一个键,另外10列......

回答 1 投票 1

强制模型系数来清理2列数据帧

我正在使用交叉验证的弹性网络,我正在研究每个预测器的系数有多大:lambda

回答 2 投票 0

使用公式将新列添加到数据框

我有一个数据框,head()看起来像这样:CEMETERY SEX CONTEXT RaHD L RaHD R DIRECTIONAL ASYMMETRY 1 Medieval-St。 Mary Graces FEMALE 7172 21.2 21.6 ......

回答 2 投票 0

从子集创建数据框并排除数据

这些是我的两个数据框的head()s(我有几个但是有不同的EXPANSIONs(骨头):CEMETERY CONTEXT SEX EXPANSION VALUE 613 Medieval-St.Mary ...

回答 2 投票 2

使用dplyr重复采样data.frame

我有这个data.frame:x

回答 3 投票 1

在数据框中填写连续值

我有一个R数据处理问题。我在.csv文件中有大量数据,我可以使用readr加载。问题是我需要添加到数据帧的缺失值。 ...

回答 2 投票 4

访问DataFrame的每个条目并以更好的方式替换它们?

这个问题是我发布的上一个问题的另一个问题。我想要做的是将DataFrame的字符串值替换为其第一个初始字符串。例如,s = pd ....

回答 3 投票 1

在数据帧的for循环中使用数组值

我有一个数据框,其中一列代表客户名称。我用客户名做了一个ndarray,我试着在customer.values中为我写一个循环:print df [df [cust_name == i] ...

回答 1 投票 0

回答 1 投票 1

python:使用多级索引子集化数据帧[重复]

我正在尝试使用多级索引对数据帧进行子集化。例如:df = pd.DataFrame({'state':['CA','WA','CO','AZ'] * 3,'office_id':range(1,7)* 2,'.. 。

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.