我如何获取所有列的统计信息,包括数据框,列表或数组中具有嵌套数值结构的列?

问题描述 投票:0回答:1

什么是获取数据帧(或列表或数组)中任何列的简单描述统计信息的最佳方法,无论是否嵌套,这是一种高级df.describe(),它还包括带有数值的嵌套结构。

就我而言,我有一个包含许多列的数据框。有些列的每一行都有一个数字列表(在我的情况下是时间序列),它是嵌套结构。它是一个数据帧并不重要,问题中还包括其他结构,因为它们之间的更改很快。

我的意思是类似的嵌套结构>

  • 数组列表,
  • 数组数组,
  • 一系列列表,
  • 在某些列中带有嵌套数值列表的数据框(我的情况)
  • 您需要获得简单的描述性统计信息。

要求

df.describe() 

将仅提供数字列的统计信息,但不提供包含具有这些数字值列表的列的统计信息。我不能仅通过应用]获得统计信息

from scipy import stats
stats.describe(arr)

因为这是How can I get descriptive statistics of a NumPy array?中非嵌套数组的解决方案。

获得嵌套或不嵌套的数据帧(或列表或数组)中任何列的简单描述统计信息的最佳方法是什么,它也是一种高级df.describe(),它还包括嵌套的...

python-3.x pandas numpy multidimensional-array scipy.stats
1个回答
0
投票

我的第一种方法是先获取每个数字列表的统计信息,然后再次获取该数字统计信息,例如然后,均值的平均值或方差的平均值也会给我一些信息。

[stats.describe([a[x] for a in [stats.describe(x) for x in NESTEDSTRUCTURE]]) for x in range(6)]
© www.soinside.com 2019 - 2024. All rights reserved.