numpy.cov或numpy.linalg.eigvals给出了错误的结果

问题描述 投票:1回答:1

我有高(100)维数据。我想得到数据协方差矩阵的特征向量。

Cov = numpy.cov(data)
EVs = numpy.linalg.eigvals(Cov) 

我得到一个包含一些复数的特征值的向量。这在数学上是不可能的。当然,复数的虚部非常小,但后来仍然会引起问题。这是一个数字问题吗?如果是这样,问题在于cov,eigvals功能还是两者兼而有之?

为了给它更多的颜色,我在Mathematica中进行了相同的计算,当然,这给出了正确的结果。结果发现有一些特征值非常接近于零而不是安静的零和numpy得到所有这些错误(大小明智并且它们中的一些变成复数)

numpy covariance
1个回答
0
投票

我面临着一个类似的问题:np.linalg.eigvals正在返回一个复杂的向量,其中虚部到处都是准零。

使用np.linalg.eigvalsh代替我修复它。

我不知道确切的原因,但很可能是一个数字问题,eigvalsh似乎处理它,而eigvals没有。请注意,实际特征值的排序可能不同。


以下代码段说明了此修复程序:

import numpy as np
from numpy.linalg import eigvalsh, eigvals

D = 10
MUL = 100
EPS = 1e-8

x = np.random.rand(1, D) * MUL
x -= x.mean()
S = np.matmul(x.T, x) + I
# adding epsilon*I avoids negative eigenvalues due to numerical error
# since the matrix is actually positive semidef. (useful for cholesky etc)
S += np.eye(D, dtype=np.float64) * EPS 

print(sorted(eigvalsh(S)))
print(sorted(eigvals(S)))
© www.soinside.com 2019 - 2024. All rights reserved.