使用单一特征(在本例中为距离)训练模型,同时使用观察权重是否正确?
我正在尝试训练一个机器学习模型,其中唯一的输入特征是距离。此外,我还有一个代表观察权重的权重列,以及一个指示距离是高还是低的目标变量(这是我想要预测的目标)。
仅用一个特征(在本例中为距离)来训练模型是否合适?另外,在处理这样的加权数据时,您会推荐什么类型的模型?
提前致谢!
我尝试使用逻辑回归和随机森林等模型,仅将距离作为输入特征。我希望模型能够学习距离和目标变量(高或低)之间的关系。此外,我应用权重来更加重视某些观察结果,但我不确定这是否是实现它的最有效方法,或者其他模型在加权数据下是否会表现更好。
是的,您可以使用单个特征训练模型,也可以使用观察权重。两者没有任何关系,完全可以混用。同样,模型的选择也与观测数据是否加权无关。
简单地说,分别思考每件事: