SKlearn分类器的诅咒

Question

假设我们有1,000个珠子，分别是900个红色和100个蓝色。当我通过SKlearn分类器集合运行问题时，

score = clf.score（X_test，y_test）

但是，他们给出的分数约为.9，当我查看这些预测时，我发现它已经预测出所有的结果都是红色的，这就是90％的准确性！请告诉我我做错了什么？更好的是，发生这种情况意味着什么？有没有更好的方法来测量准确性？

Answer 1

您有一个不平衡的分类问题。您是在写作，默认情况下，分数会测量准确性，但是建议您查看不平衡数据的召回率和准确性。

上面的视频向您展示了如何衡量数据中的分类效果。要处理数据不平衡问题，请检查imblearn库：