我正在处理包含200万个观测值的高频数据。现在,我需要计算每日实现的协方差矩阵,定义为:
我的数据具有以下结构:
Year Month Day FivMin A B C D 2000 1 1 1 1 2 3 4 2000 1 1 2 2 3 0 1 2000 1 1 3 3 4 1 2 2000 1 1 4 0 1 2 3 2000 1 2 1 1 2 3 4 2000 1 2 2 5 3 4 1 2000 1 2 3 3 0 1 2 2000 1 2 4 4 1 9 3 2000 1 3 1 1 2 3 4 2000 1 3 2 0 1 7 1 2000 1 3 3 3 4 1 2 2000 1 3 4 1 -2 2 3 2000 1 4 1 0 2 3 4 2000 1 4 2 2 1 4 1 2000 1 4 3 3 0 1 2 2000 1 4 4 0 2 2 3 2000 1 5 1 1 2 3 4 2000 1 5 2 2 3 4 1 2000 1 5 3 0 -1 1 2 2000 1 5 4 9 1 2 3
变量A,B,C和D代表每五分钟记录的价格。因此,我的第一个想法是将
group_by
与变量Year,Month和Day结合使用,以创建矩阵。在此之后,我需要计算每天的已实现Cov。
例如,第一天,我的变现系数为:
此操作必须每天重复。我是否有针对此问题的软件包。也许最好使用循环。
感谢您的帮助。
我正在处理包含200万个观测值的高频数据。现在,我需要计算每日实现的协方差矩阵,定义为:设为日内价格向量,然后将...
这里是使用split
(用于分组)+ tcrossprod
(用于cov矩阵)的基本R解决方案