我正在实施逻辑回归。我知道已经有很多数据库来实现它。但问题是我无法理解这些。所以我为其创建了自己的数据集。
它有 3 个东西,
House Price
、Standard
和 Buying Decision
Standard
代表生活水平。0
:低1
:中等2
:高
房价很低的时候,只有生活水平低(
0
)的人才会买。
当房子很高很高的时候,只有生活水平高(2
)的人才会买。
这是我的实现的数据集和 ipynb 文件
测试数据集将array(1,1,0,0)
作为购买决策,但我的模型给出了
array(0,1,1,1)
我知道我的数据集很小,但这一定不是精度如此低的唯一原因。我做错了什么?如何执行。
请告知我该链接无法访问。谢谢你。
由于功能如此有限,使用聚类等无监督学习方法来创建新功能并更好地表示潜在模式可能是有意义的。
简单来说,解决办法就是预处理。