有一组对象要分为n类。每个类别都有自己的系数。
例如:
class coefficient
1 0.5
2 0.7
N 0.4
我将对象分类并获得系数集。但我需要确定一个最适合整个对象集的系数。
如何聚合对象的系数并选择一个公共系数?平均系数法除外。
这取决于您的数据的性质以及问题的任何具体要求。
您可以对数据执行各种统计分析,看看哪些提供了最佳分类。
例如,中位数和众数在处理异常值时特别有用。调和和几何平均值适用于乘法数据,还有许多其他方法可以应用。
import numpy as np
from scipy import stats
def get_aggr(C):
_med = np.median(C)
_mod = stats.mode(C).mode
_hmean = stats.hmean(C)
_gmean = stats.gmean(C)
_trim_mean = stats.trim_mean(C, 0.1)
return _med, _mod, _hmean, _gmean, _trim_mean
C = [0.5, 0.7, 0.4, 0.5, 0.6, 0.4]
print(get_aggr(C))
(0.5, 0.4, 0.49606299212598426, 0.5060788802128566, 0.5166666666666666)