X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=0)
在上面的代码中,
random_state
使用了0。为什么我们不使用1?
random_state
的0或1都没有任何意义,该参数控制随机数生成器使用的种子,因此设置为任何值都意味着分割是随机的,但每次调用都会得到完全相同的结果。
这通常用于再现性,但通常您不应该依赖
random_state
作为特定值。
如果您将
random_state
设置为 None,每次您调用 train_test_split
时,它总会有不同的随机行为。