PCA 是一种降维算法,有助于降低数据的维度。 我不明白的是,PCA 按降序给出特征向量的输出,例如 PC1、PC2、PC3 等。所以这将成为我们数据的新轴。
我们可以在哪里应用这个新轴来预测测试集数据?
我们实现了从 n 到 n-k 的降维。
PCA 的思想是将维度减少到由具有最大方差的 n-k 个特征向量创建的子空间,从而导致映射到新子空间的数据中的最大方差。
此外,可以在不知道训练数据类别的情况下使用 PCA 来降低维数,这意味着它是无监督的。
如果您知道训练数据的类别,则另一种选择是使用 LDA,它会尝试找到最大化类别间变异的特征空间。