试图了解SKLearn回归预测数组

问题描述 投票:0回答:1

我对Python编程非常陌生,甚至对SKLearn和ML还是比较新。因此,请原谅我对这些主题的无知。

我已经开始尝试SKLearn回归模型和代码,但是遇到了一个基本问题,无法理解该实验代码的结果。

给出下面的代码,相对于假设的某件商品的每日销售数字,我试图找出LinearRegression模型的predict()函数的结果是什么,将其存储在sales_data数组中。

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

sales_data = [3, 7, 2, 4, 6, 8, 5, 10, 9, 6, 4, 7, 11, 6, 3, 1, 4, 5, 8, 10, 7] # May be a much larger array in int's

x_train = []
y_train = []
x_test = []
y_test = []
X = sales_data
Y = sales_data

x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.25, train_size = 0.75, random_state = 1)

x_train = np.array(x_train)
y_train = np.array(y_train)
x_test = np.array(x_test)
y_test = np.array(y_test)

x_train = x_train.reshape(-1, 1)
x_test = x_test.reshape(-1, 1)

lregressor = LinearRegression()
lregressor.fit(x_train, y_train)
lregressor_pred = lregressor.predict(x_test) # Trying to understand what the predicted array represents to sales_data

1)预测的数组是否代表该商品隔日销售的可能结果?

2)预测的数组是从最有可能到最有可能的销售数字排序的吗?

如果以上两个都不成立,请您简单地解释一下预测数组代表什么,以及如何将其用于预测第二天的商品销售,或者猜测可能添加到sales_data中的下一个整数数组。

我还在LogisticRegression和RandomForest回归模型中使用了类似的代码,但仍然不了解预测结果以及如何使用它们。

非常感谢

scikit-learn linear-regression
1个回答
0
投票

1)预测的数组是否代表该商品隔日销售的可能结果?

没有它是x_test中每个样本的预测数组。

2)预测的数组是从最有可能到最有可能的销售数字排序的吗?

没有它的排列顺序与x_test的排列顺序相同。

© www.soinside.com 2019 - 2024. All rights reserved.