我目前正在尝试使用 Graph Convolutional 实现 Timestamp-Supervised Action Segmentation 网络,但我一直在为图形创建邻接矩阵。
我得出的结论是张量的形状应该是 [num_frames, num_frames, width, height],因为根据我的实验,torch 框架的余弦相似度函数返回 [width, height] 形状的结果,但我开始认为我对此也错了。我正在 GTEA 数据集上对其进行测试。此外,如果这是形状,我应该如何将它添加到论文中传播公式的单位矩阵中?