诸如SVM和XGBoost的分类算法需要花费大量的时间进行训练,并且在特定数据集上运行需要花费一些时间,而对于相同的数据集,其他分类算法只需不到10秒即可完成。
总数据集大小= 141,000个数据点,训练集=总数据集的75%,而测试集=总数据集的25%。
有没有找到要训练的模型花费时间的方法?
数据包含41个属性,其中3个属性是标称属性,并使用伪编码进行编码。编码后,共有110个属性。
注意:数据集已分类,所以我不能在这里共享。
首先,多少时间就是太多时间? XGBoost的工作方式应该比其他算法花费更长的时间。 XGBoost的本质是考虑到每个生成的树的错误来串联构建树。
与此无关,有很多方法可以找出消耗的时间。您可以在此线程中找到一些。他们运作良好。 https://discuss.analyticsvidhya.com/t/how-to-calculate-the-model-building-and-predicting-time-of-a-classifier-in-python/6334。