有关统计预测的问题,尤其是编程任务。
我正在尝试通过使用以下示例数据来获取网站的日常阅读文章的用户兴趣预测:从datetime导入日期开始,从timedelta导入熊猫作为pd导入numpy,作为np sdate = ...
在为我的数据集运行k-means后,k = 4,然后进行线性回归,然后打印了预测的Y。现在,我想找到预测的准确性。使用df1 =尝试使用sklearn后,...>
AttributeError:'list'对象没有属性'shape'?
[有人可以帮我,我一直在尝试在X_train = np.reshape(X_train,newshape =(X_train.shape [0],X_train.shape [1],1))下运行脚本,但是这样的错误AttributeError ...
什么是“验证集”,为什么为0,我尝试写RMS公式,但收到错误“ ZeroDivisionError”
rms = np.sqrt(np.mean(np.power((np.array(valid ['price']]-preds),2))))print('\ n验证集上的RMSE值:')打印(rms)ZeroDividedError集验证集(0,232)并且数据集位于以下位置...
[我正在研究一个时间序列分析项目,以预测股票价格,使用get_forecast()时遇到一个问题,而get_predictions()很好,并且模型适合...
[训练XGBoost分类模型时,我使用eli5函数“ explain_prediction()”来查看特征对单个预测的贡献。但是,eli5软件包似乎在...
假设我们有1,000个珠子,分别是900个红色和100个蓝色。当我通过SKlearn分类器集合运行问题时,score = clf.score(X_test,y_test)他们得出的分数约为.9,但是,...
使用SGDclassifier的predict_proba使用多类分类的多类分类置信度得分
我正在SGDClassifier中使用Logistic回归来执行〜10k类别的多类分类。为了获得预测结果的置信度分数,我正在使用predict_proba函数。但我得到...
我正在尝试为使用mlr软件包中的makeStackedLearner拟合的集成模型得出预测误差。这些是我要执行的步骤:> library(mlr)> library(matrixStats)> ...
我将通过RNN进行时间序列预测的简介,并将代码修改为其他数据集。随着数据的标准化,使用:uni_train_mean = uni_data [:...
我遇到一个问题,在尝试预测R中的单个结果时会得到数百个结果。有关如何解决此问题的任何建议都将非常有帮助。 logwage
我可以在python中使用哪种方法根据过去的数据确定值的可能性?
我有一个很大的“时间序列”数据集,看起来像这样:日期星期几自上次快乐外出的天数城外快乐1/1/20星期一0 1 ...
我正在作为一个项目进行糖尿病的预测和统计。对于统计数据,我正在寻找一个我可以调用的API来获取数据,该数据可用于统计每天的糖尿病增长情况,或...
我有两列的时间序列数据:日期和体积,例如在此处输入图像描述,我想预测第二天的体积,那么如何设置参数? P / S:我将预测范围设为1 ...
我正在研究一个项目,在项目中我必须预测第二天的销售额。我正在使用ARIMA模型,并通过熊猫read_sql_table函数从mysql加载数据。问题是我的日期已保存...
如果这里的人们可以看一下这段代码并尝试帮助评估这些预测间隔是否正确计算或需要更改什么,将不胜感激。我...
我想使用贝叶斯分类找到ali(öksürük= var,ateş= yok,halsizlik = var)的类值。下面的代码正在工作,但是我收到警告消息:1:naive_bayes():功能Öksürük-...
对于大的缺失,插补与对随机森林的可用子集进行训练相比有什么优势?
我想在缺失较大的数据集上训练随机森林模型。我知道“标准方法”,即我们在训练集中估算缺少的数据,对...