我的问题在金融方面很常见。
给定数组w(1xN)权重和资产的协方差矩阵Q(NxN),可以使用二次表达式w'* Q * w计算投资组合的协方差,其中*是点积。
我想了解当我有权重W(T x N)的历史和协方差矩阵(T,N,N)的3D结构时,执行此操作的最佳方法是什么。
import numpy as np
import pandas as pd
returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()
weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
到目前为止,我的解决方案是将pandas DataFrames转换为numpy,执行循环计算,然后转换回pandas。请注意,我需要明确检查标签的对齐情况,因为实际上协方差和权重可以通过不同的过程来计算。
cov_dict = {key: covariance.xs(key, axis=0, level=0) for key in covariance.index.get_level_values(0)}
def naive_numpy(weights, cov_dict):
expected_risk = {}
# Extract columns, index before passing to numpy arrays
# Columns
cov_assets = cov_dict[next(iter(cov_dict))].columns
avail_assets = [el for el in cov_assets if el in weights]
# Indexes
cov_dates = list(cov_dict.keys())
avail_dates = weights.index.intersection(cov_dates)
sel_weights = weights.loc[avail_dates, avail_assets]
# Main loop and calculation
for t, value in zip(sel_weights.index, sel_weights.values):
expected_risk[t] = np.sqrt(np.dot(value, np.dot(cov_dict[t].values, value)))
# Back to pandas DataFrame
expected_risk = pd.Series(expected_risk).reindex(weights.index).sort_index()
return expected_risk
是否有纯熊猫的方法来达到同样的效果?或者代码是否有任何改进,以提高效率? (尽管使用numpy,它仍然很慢)。
我认为numpy绝对是最好的选择。虽然如果你循环使用值/日期,你会失去效率。
我建议计算投资组合的滚动波动率(没有循环):
returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()
weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
rows, columns = weights.shape
# Go to numpy:
w = weights.values
cov = covariance.values.reshape(rows, columns, columns)
A = np.matmul(w.reshape(rows, 1, columns), cov)
var = np.matmul(A, w.reshape(rows, columns, 1)).reshape(rows)
std_dev = np.sqrt(var)
# Back to pandas (in case you want that):
pd.Series(std_dev, index = weights.index)