不同大小的多个特征集进行分类

问题描述 投票:0回答:1

我有多个不同的特征集。这些特征被存储在数据帧中。问题是,它们的大小不一样.我的第一个特征集是一个512长大小的浮点数向量.第二个特征集是12个浮点数.等等。

我想在所有这些特征集上使用不同的分类器。我想我不能把所有的特征都放在一个向量上,因为由于维度和小向量的缺失影响,性能会下降。

所以我有一个想法:在每个特征集上训练多个分类器,将这些结果作为一个新的特征集用于最终的分类器。

有什么标准的方法来处理这样的问题吗?

machine-learning bigdata classification
1个回答
1
投票

如果我没看错,你的所有特征集都描述了相同的输出,那么基于所有特征进行预测是最合理的。我会选择你的第一个建议。

  • 把所有的特征合并到一个向量中 虽然是长的向量 但对于SVM这样的分类器来说应该不是问题 它的目的是为了与SVM一起工作 众多 的特点。

你的另一个想法。

  • 为每个特征集训练一个单独的分类器 听起来像是增加了额外的复杂性。首先,你要担心多一个抽象的问题。其次,如果数据量有限,小的初始分类器可能不是那么好,小的特征集(例如与单个SVM相比)。

tl;dr:我会合并所有的特征(当然,如果不同的集子描述的是相同的observationvariables),然后用SVM来使用它们。

© www.soinside.com 2019 - 2024. All rights reserved.