我正在为我的数据集使用不同的机器学习算法。我正在使用python。我是机器学习的初学者。
这是我的数据集的可视化。可以理解的是,线性回归在整个集合中表现不佳。
我愿意将图表分为3个区域。喜欢这张图片。我想有3个区域,分别是常数部分,多项式部分和线性部分。
我想先预测X,然后需要知道X位于哪个部分,然后将根据该部分拟合模型。就像X位于多项式部分上一样,系统将识别为多项式部分,并且需要拟合为多项式回归。
我的问题是如何以这种方式实现它?请提供您宝贵的建议来帮助我。
在我看来,您可能需要使用逻辑回归而不是线性回归。数据的形状非常规则且具有数学意义,您只需要找到合适的方程即可。
我使用具有10个估计量的随机森林回归量,在此数据集上表现良好。它的r2得分为0.98。我也尝试过SVR,但是它不能正确地容纳数据点。