属性选择+ weka +朴素贝叶斯

问题描述 投票:0回答:2

我想知道以下三种方法中哪种方法最适合执行属性选择:

  1. 使用元分类器
  2. 过滤方法
  3. 本机方法,直接使用属性选择类

我正在使用的分类器是朴素贝叶斯。

谁能引导我找到最好的选择?

weka naivebayes document-classification
2个回答
0
投票

嗯,没有一个答案。

  1. 您可以使用决策树分类器(如装袋)并选择分类器采取分支决策的属性。您可以看到树当然要查看分支和基于其进行分支的属性(这些属性很重要)。
  2. 您可以使用前向选择或后向消除技术。 (a)在前向选择中,使用单个功能,验证/测试集上的错误最少。然后,使用功能池中包含的此功能,一次尝试其余功能,并选择再次提供最少错误的功能。 (b)在反向消除中,使用所有功能并采用错误率。然后一次消除一个功能。然后选择要从功能池中取出的功能,以最大限度地减少错误。

除非您对功能数量(停止标准)感到满意,否则请继续此过程。

  1. 我个人使用排名算法和infogain属性评估器首先对属性进行排名,然后使用2(a)或2(b)来选择属性。

错误 - 您可以考虑均方根误差。其他人也可以做得很好。


1
投票

有一种叫做No free lunch的理论。您应该在问题中尝试所有这三个问题,并在您的域中生成一个衡量标准。

© www.soinside.com 2019 - 2024. All rights reserved.