主成分分析(PCA)是一种用于降维的统计技术,通常用于聚类或因子分析。给定任意数量的解释或因果变量,PCA根据解释数据中最大变化的能力对变量进行排名。正是这种特性允许PCA用于降维,即从大的可能影响中识别最重要的变量。
我的数据集是31000行,具有13个属性。但是因为大多数是分类的,所以我不得不对这些属性使用NominalToBinary,因此属性增加到61。我将数据采样到...
我正在尝试在Julia笔记本中实施内核主成分分析(kernel PCA)的方法。更具体地说,我正在尝试复制本教程中完成的过程:https:// ...
这个问题的重点是:我应该保留哪些组件?有一个具有这种结构的数据集:每行都与目录中的图像相关联。可变的置信度是一个虚拟的...
scatter3d():chol.default(shape)错误:前导未成年人不是正定的
我目前正在尝试在R中进行原理坐标分析(PCoA)。我对R还是很陌生,仍在尝试学习语法和代码。我成功运行了PCoA,并对其进行了绘制,然后...
我正在执行PCA,并根据最大的explained_variance_ratio_ ERROR提取特征:在两个组件中,最大的组件具有相同的索引,即对应于相同的特征。在...
我可以仅使用PDB文件执行PCA(在python3.x中使用MDAnalysis吗?
我可能比与代码相关的问题更具技术性。我尝试仅使用PDB文件执行PCA(带有MDAnalysis包)-此pdb文件包含100个对齐的结构(当然,它们是相同的-...
我有一个由6个输入变量(温度,压力,流速等)组成的大日期集,以提供诸如产量,纯度和转化率的输出。总共大约有47600个实例,并且...
Python和SAS产生具有相同绝对值的PCA数据。值,但符号倒置-为什么?
我正在构建Python 3(用于数据处理的熊猫,用于通过SVD进行PCA的numpy)以模仿我在研究生院编写的一些代码。该代码在SAS 9.4中使用PROC IML在光谱矩阵上调用svd。 ...
最初,我有400,000张图像被标准化(灰度值增加)。之后,我对每张图片进行了DFT,并获得了3200个绝对傅里叶系数的400000个样本的数据。现在我...
当我将statsmodels.multivariate.pca.PCA应用于某些数据时,我发现所产生的特征值之和不等于数据的总方差。我正在使用以下代码...
在Jupyter Notebook上使用PCA可视化(绘制)数据集csv
我有以下代码显示了来自csv文件的垃圾邮件/火腿邮件列表... data = pd.read_csv('spam.csv',encoding ='latin-1',delimiter ='\ t', header = None)我想显示图的数据(...
在带有R中的M3C的pca()中的数据帧中用“ 0”和“ -inf”进行处理
我有一个数据帧,其中包括colnames中的sample_id,行名中的基因名和值矩阵(rnaseq tpm)。我想从M3C包中执行pca()。我首先用log2变换了矩阵...
如何使用ggplot2增加PCA Biolot黄色圆圈内的文本大小?
如何1)使用ggplot2增加PCA-Bioplot黄色圆圈内的文本大小? 2)我们称之为什么?使用的代码:p
“ plot_label中的错误(p = p。。。不支持的类:prcomp“
我看到最近(2019年3月24日)报告了相同的问题。以前能够将ggbiplot用于prcomp对象。现在我得到以下错误:这是我的代码:> pca
[使用PCA技术和耶鲁数据库,我试图通过将训练过程随机分为20%,将测试过程分为80%在Matlab中进行人脸识别。给出...
'predict.pca'不是从'namespace:mdatools'导出的对象]]
我是R环境中的新手,我是编程的初学者。我一直在使用mdatools软件包对该模型进行PCA分析和预测,但是当...