分类中的聚合方法

问题描述 投票:0回答:1

有一组对象要分为n类。每个类别都有自己的系数。

例如:

class      coefficient
 1             0.5
 2             0.7
 N             0.4

我将对象分类并获得系数集。但我需要确定一个最适合整个对象集的系数。

如何聚合对象的系数并选择一个公共系数?平均系数法除外。

math statistics classification statistical-test
1个回答
0
投票

这取决于您的数据的性质以及问题的任何具体要求。

您可以对数据执行各种统计分析,看看哪些提供了最佳分类。

例如,中位数和众数在处理异常值时特别有用。调和和几何平均值适用于乘法数据,还有许多其他方法可以应用。


import numpy as np
from scipy import stats

def get_aggr(C):
    _med = np.median(C)
    _mod = stats.mode(C).mode
    _hmean = stats.hmean(C)
    _gmean = stats.gmean(C)
    _trim_mean = stats.trim_mean(C, 0.1)
    return _med, _mod, _hmean, _gmean, _trim_mean


C = [0.5, 0.7, 0.4, 0.5, 0.6, 0.4]
print(get_aggr(C))

打印

(0.5, 0.4, 0.49606299212598426, 0.5060788802128566, 0.5166666666666666)

© www.soinside.com 2019 - 2024. All rights reserved.