什么是获取数据帧(或列表或数组)中任何列的简单描述统计信息的最佳方法,无论是否嵌套,这是一种高级df.describe(),它还包括带有数值的嵌套结构。
就我而言,我有一个包含许多列的数据框。有些列的每一行都有一个数字列表(在我的情况下是时间序列),它是嵌套结构。它是一个数据帧并不重要,问题中还包括其他结构,因为它们之间的更改很快。
我的意思是类似的嵌套结构>
您需要获得简单的描述性统计信息。
要求
df.describe()
将仅提供数字列的统计信息,但不提供包含具有这些数字值列表的列的统计信息。我不能仅通过应用]获得统计信息
from scipy import stats stats.describe(arr)
因为这是How can I get descriptive statistics of a NumPy array?中非嵌套数组的解决方案。
获得嵌套或不嵌套的数据帧(或列表或数组)中任何列的简单描述统计信息的最佳方法是什么,它也是一种高级df.describe(),它还包括嵌套的...
我的第一种方法是先获取每个数字列表的统计信息,然后再次获取该数字统计信息,例如然后,均值的平均值或方差的平均值也会给我一些信息。
[stats.describe([a[x] for a in [stats.describe(x) for x in NESTEDSTRUCTURE]]) for x in range(6)]