dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

PySpark RDD到数据帧,带有元组和字典列表

我在pyspark中处理了一些数据,它是一个具有这种结构的RDD [(u'991',{'location':'Australia','Age':'27','Color':Pink}),(u '993',{'location':'新加坡','年龄':'55','......

回答 1 投票 0

如何聚合集合列?

我有一个pandas数据框,其中特定列中的行是id组。我希望在15分钟内聚合并找到所有这些独特的ID。时间戳| ids | ...

回答 2 投票 3

如何根据特定列中的空值从数据框中删除行?

如何根据特定列中的空值从数据框中删除行?假设我有一个包含三列a,b,c的数据框,并且所有数据都可以包含空值,但我只想删除列b ...

回答 1 投票 0

DataFrame中包含的系列的平均值

以下DataFrame(df)有3列:Event,Counts和Length,其中Counts列包含一系列数字。我想估计每个Counts行的平均值并将其显示在...上

回答 2 投票 2

取消堆叠/拆分数据帧并将数据帧的部分/块写入分配给密钥的多个csv

问题我正在读取多个csv,它们匹配某种模式,将它们连接成一个数据帧并在帧内进行一些处理(例如填充日期时间间隔,构建平均值等)。在......

回答 1 投票 0

用循环生成的连接pandas DataFrames

我正在创建一个名为data_day的新DataFrame,其中包含新功能,每天从前一个DataFrame df的日期时间戳推断出来。我的新数据框data_day是30个独立的......

回答 3 投票 2

Dataframe vlookup用于另一个数据帧中的日期

我有一个数据帧(df),其中索引是日期Alpha Bravo 1997-01-02 21.14 699.25 1997-01-03 31.14 799.25 1997-01-06 41.14 899.25 1997-01-07 51.14 999.25 ...

回答 1 投票 1

python 3.5 pandas读取excel并转换为列表

我有一个excel文件,其数据如下所示:Col_Title1 | Col_Title2 | Col_Title3 |标签Row11 | Row12 | Row13 | 1 Row21 | Row22 | Row23 | 2 Row31 | Row32 ......

回答 3 投票 1

如何根据数据框和numpy中的协变量对观测进行分类?

我有一个带有n个观测值的数据集,并说出2个变量X1和X2。我试图根据它们的(X1,X2)值的一组条件对每个观察进行分类。例如,数据集看起来像......

回答 2 投票 3

Python pandas数据帧为什么使用双方括号

为什么打印(数据[“列”]。形状)打印(1819,)和打印(数据[[“列']]。形状)打印(1819,1)

回答 1 投票 0

计算数据帧R中成对出现的字符数

这是对这个问题的延伸,但我找不到答案,所以我要求新鲜。我有一个数据框,其中一个小样本看起来像这样:X 73600000 73680000 ...

回答 2 投票 1

R - 基于条件的情节中的组织样线的不同颜色

我有一个看起来像这样的数据框(df)意味着t值0.004 3.12 0.021 3.41。 。 。 。 -0.067 -3.60我的实际data.frame有90 ...

回答 2 投票 0

Pandas替代应用 - 基于多列创建新列

我有一个Pandas数据帧,我想根据其他列的值添加一个新列。下面是一个说明我的用例的最小例子。 df = pd.DataFrame([[4,5,19],[1,2,0],[2,5,9] ......

回答 1 投票 4

将If Then逻辑应用于数据帧R.

我想我可能会比我能咬得更多。我试图基于几个因素将逻辑方程应用于一组数据,以便为每年制定最终估计。我把所有数据都记在了......

回答 1 投票 -1

展平嵌套的pandas数据帧列

在一些聚合之后,我的数据帧看起来像这样A B B_min B_max 0 11 3 6 1 22 1 2 2 33 4 4如何使列成为A,B_min ......

回答 1 投票 1

如何将不规则数据的多级字典转换为所需的格式

Dict = {'Things':{'Car':'Lambo','Home':'NatureVilla','Gadgets':{'Laptop':{'Programs':{'Data':'Excel','Officework' :'Word','Coding':{'Python':'PyCharm','Java':'Eclipse','Others':'SublimeText'},...

回答 2 投票 0

如何在pandas数据帧的索引中使用map

我想使用索引上的值和一个将这些值转换为更有意义的字典的字典在pandas数据框上创建一个新列。我最初的想法是使用地图。我到了......

回答 2 投票 0

Python Pandas基于最小索引从数据帧中提取值

我有一个df:import pandas as pd import numpy as np df = pd.DataFrame({“price”:[1.1,66.3,11,15.2,1.1],“qty”:[14,2,1,10 ,1],“c_h”:['cheese','ham','ham','...

回答 2 投票 0

访问大熊猫数据一百万次 - 需要提高效率

我是一名试图验证实验的生物学家。在我的实验中,我在特定治疗后发现了71个突变。为了确定这些突变是否真的是由于我的治疗,我想......

回答 1 投票 3

根据每个数据帧中的因子将数据帧列表拆分为多个列表

我有一个数据框列表,其中包含(x,y)坐标的时间序列。每个数据框还有一个特定的变量 - trial_option - 我想用它来将我的数据帧列表拆分成多个...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.