为什么我的Logistic回归有25%的准确率?

问题描述 投票:0回答:1

我正在实施逻辑回归。我知道已经有很多数据库来实现它。但问题是我无法理解这些。所以我为其创建了自己的数据集。

它有 3 个东西,

House Price
Standard
Buying Decision

Standard
代表生活水平。
0
:低
1
:中等
2
:高

房价很低的时候,只有生活水平低(

0
)的人才会买。 当房子很高很高的时候,只有生活水平高(
2
)的人才会买。

这是我的实现的数据集和 ipynb 文件

测试数据集将

array(1,1,0,0)

 作为购买决策,但我的模型给出了 
array(0,1,1,1)

我知道我的数据集很小,但这一定不是精度如此低的唯一原因。

我做错了什么?如何执行。

请告知我该链接无法访问。谢谢你。

python csv machine-learning logistic-regression
1个回答
0
投票
我想也许能帮上忙,但你没有错;你的数据集很小。这可能是准确性不令人满意的主要原因。然而,缺乏数据感是一个我们可以插值或使用合成数据生成(如 SMOTE)的问题。

由于功能如此有限,使用聚类等无监督学习方法来创建新功能并更好地表示潜在模式可能是有意义的。

简单来说,解决办法就是预处理。

© www.soinside.com 2019 - 2024. All rights reserved.