我正在尝试使用imblearn的random under-sampler来处理不平衡的数据集。我想指定手动欠采样的标签数量。这是我的代码:
sm = RandomUnderSampler(ratio = {0:142498, 1: 495}, random_state=42)
X_train, y_train = sm.fit_sample(X_tr,encoded_Ytrain)
print(format(Counter(y_train)))
但是,这会引发错误:
文件“first_approach.py”,第56行,在<module> X_train中,y_train = sm.fit_sample(X_tr,encoded_Ytrain)引发ValueError('比例的未知参数类型。')ValueError:比率的未知参数类型。
传递相同的语法应该是什么?
尝试安装0.3版
imblearn 0.2.1不支持字典。您需要从源代码安装它。
pip install -U git+https://github.com/scikit-learn-contrib/imbalanced-learn.git