为什么在 k 折的情况下需要单独的测试集,而不是在留一交叉验证(LOOCV)的情况下?
怀疑存在于交叉验证中——我心里有某种困惑。当我们进行 LOOCV 时,据说我们将整个数据用于训练,并且我们不会对单独的测试集进行训练-测试分割。
而在 K 折 cv 的情况下,我们必须保留单独的测试集,以免导致数据泄漏。
不会造成LOOCV数据泄露吗?虽然两者的方法相同,但 LOOCV 也是 k 倍,只是 k = n,n = 数据样本数。
我尝试在互联网上搜索此问题,但没有找到任何解释。
我认为你在这里有一个误解。当我们进行 LOOCV 时,每次训练模型时,我们都会获取除一个数据点之外的整个数据,并使用我们留下的单个数据点进行测试。该单个数据点充当单独的测试集。因此我们称之为“留一法”交叉验证。