在幕后
Scikit-Learn
进行了here定义的大量输入验证检查,例如检查(X,y)形状、预期标量/数组、确保估计器已安装等。在设计模型时,这些检查非常有用捕获早期错误,但一旦投入生产,这些就会成为大型成熟管道中的运行时开销。
目前有什么方法,也许通过全局设置,传入关键字参数,或类似的方式来禁用管道、估计器和变压器中的这些内部检查?
从 this scikit 讨论中,我们可以通过以下方式设置全局设置:
import sklearn
sklearn.set_config(
assume_finite=True, # disable validation
)