我目前正在使用 WEKA 和基于住房的数据集。我有一个数值变量“平方英尺”和一个二进制是/否变量“需求”。 我试图找出哪个数量或平方英尺范围最有可能属于需求类别(所以什么尺寸的房产需求最高)。
我尝试在 WEKA 中以散点图形式将其可视化,y 轴为平方英尺,x 轴为需求量,但它没有显示足够具体的数字,仅沿轴以 3 个间隔显示,这似乎有点无用。
是否有可以在这里使用的回归模型或者更清晰的方式来可视化绘图?它必须在 WEKA 中完成,否则我只会使用 matplotlib。
[这并不是一个真正的编程问题...]
回归模型仅在类为数字时才有效,但是,您的类是名义类 (
yes/no
)。
您可以尝试使用 weka.filters.supervised.attribute.Discretize 过滤器离散化输入变量。这个监督版本在生成 bin 时考虑了类属性。