假设您有一个根据某些数据(您无权访问)计算得出的
numpy histogram
,因此您只知道垃圾箱和计数。有没有一种有效的方法来计算直方图描述的分布的平均值和中位数?
不,你不能。使用直方图聚合后,精确值会丢失。
作为演示,这里有两个不同的数组(具有不同的平均值/中位数),它们给出相同的计数和 bin:
a1 = np.array([10, 20, 100, 300, 310])
np.mean(a1), np.median(a1)
# (148.0, 100.0)
a2 = np.array([10, 10, 130, 300, 310])
np.mean(a2), np.median(a2)
# (152.0, 130.0)
np.histogram(a1, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])
np.histogram(a2, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])