使用单一特征训练模型同时使用观察权重是否正确?

问题描述 投票:0回答:1

使用单一特征(在本例中为距离)训练模型,同时使用观察权重是否正确?

我正在尝试训练一个机器学习模型,其中唯一的输入特征是距离。此外,我还有一个代表观察权重的权重列,以及一个指示距离是高还是低的目标变量(这是我想要预测的目标)。

仅用一个特征(在本例中为距离)来训练模型是否合适?另外,在处理这样的加权数据时,您会推荐什么类型的模型?

提前致谢!

我尝试使用逻辑回归和随机森林等模型,仅将距离作为输入特征。我希望模型能够学习距离和目标变量(高或低)之间的关系。此外,我应用权重来更加重视某些观察结果,但我不确定这是否是实现它的最有效方法,或者其他模型在加权数据下是否会表现更好。

python machine-learning model prediction feature-selection
1个回答
0
投票

是的,您可以使用单个特征训练模型,也可以使用观察权重。两者没有任何关系,完全可以混用。同样,模型的选择也与观测数据是否加权无关。

简单地说,分别思考每件事

  • 哪些特征对于做出预测很重要?考虑包括所有重要的。
  • 某些观察结果是否比其他观察结果更重要?应用观察权重。
  • 我的标签和特征之间有什么关系?是线性的吗?也许尝试线性/逻辑回归。它是非线性的吗?也许可以尝试树、带有内核的 SVM、DNN 等
© www.soinside.com 2019 - 2024. All rights reserved.