我需要预测下一个目标事件 - 购买两个价格类别的汽车(例如,高档和中档)。训练目标的数量大致相同(假设每个价格类别有 10,000 次购买)。我在这里看到两种训练机器学习模型的方法。第一个是多类模型。第二个是两个单独的模型来预测每个细分市场。您认为应该采取哪种方法?为什么?我想以多类模型为基础,你能列出哪些优点和缺点?
TLDR:一种多类模型更容易维护,可以学习更通用的模式,并且没有相互冲突的预测。我推荐多类模型,例如 RandomForest 甚至更好的 PairwiseDifferenceLearningClassifier
优点:
缺点:
为了解决这两种方法的复杂性和局限性,我建议考虑PDL 分类器。 PDL 分类器是一种元学习器,利用实例之间的成对比较,将多类问题简化为一个二元问题。