在weka中重新采样过滤器

问题描述 投票:0回答:1

我的数据集中的数据实例数量很少。因此,我尝试了Weka中的“重新采样”过滤器来增加数据量,从而增强模型性能。样本量百分比设置为200可以吗?因为那时我在交叉验证测试中获得了良好的相关系数。

我想知道将样本大小百分比设置为 200 时,重新采样过滤器是否工作正常。 使用此过滤器后,我的模型会准确预测吗? 由于我的数据量较少,是否有其他增强方法可以增强模型的性能?

machine-learning data-science weka data-augmentation pandas-resample
1个回答
0
投票

如果您使用重采样过滤器(监督或无监督)作为 FilteredClassifier 元分类器设置的一部分,那么可以安全使用。

如果您从“预处理”面板使用它,那么您将在整个数据集中生成重复项。对此增强数据集执行交叉验证时,您最终会在训练和测试分割中出现一些实例。这可以解释您所看到的改进。

重新采样的替代方案是

SMOTE 过滤器(单独的包)。

© www.soinside.com 2019 - 2024. All rights reserved.