假设我们有1,000个珠子,分别是900个红色和100个蓝色。当我通过SKlearn分类器集合运行问题时,
score = clf.score(X_test,y_test)
但是,他们给出的分数约为.9,当我查看这些预测时,我发现它已经预测出所有的结果都是红色的,这就是90%的准确性!请告诉我我做错了什么?更好的是,发生这种情况意味着什么?有没有更好的方法来测量准确性?
您有一个不平衡的分类问题。您是在写作,默认情况下,分数会测量准确性,但是建议您查看不平衡数据的召回率和准确性。
This video explains it better than I could
上面的视频向您展示了如何衡量数据中的分类效果。要处理数据不平衡问题,请检查imblearn库: