我有来自两个不同 GNN 的两组嵌入。我想通过可视化来比较嵌入,我想知道哪种方式是最合适的比较方式。我是否为每组嵌入分别拟合 t-SNE 然后使用散点图?或者我是否将它们全部放入一个 t-SNE 中?
如果为每个嵌入集分别拟合 t-SNE,则将保留每个嵌入空间的内部结构,因为优化是独立的。然而,这种方法的散点图不能直接比较,因为 t-SNE 输出是不确定的,并且嵌入空间可以任意旋转、翻转或缩放。虽然您可以单独检查集群,但您无法深入了解两个嵌入集之间的关系。
如果将两个嵌入集上的 t-SNE 拟合在一起,嵌入将被投影到共享的低维空间中。这样可以进行直接的视觉比较,从而更容易观察两个 GNN 的嵌入是否相似。然而,这种方法存在扭曲各个嵌入空间的内部结构的风险,特别是当嵌入差异很大时。 t-SNE 算法将平衡两个集合之间和内部的关系,可能会引入伪影。
选择取决于您的目标。对于内部结构的独立分析,单独拟合 t-SNE。对于共享空间中的关系比较,联合拟合 t-SNE。
为了补充可视化,您最好包括余弦相似度或聚类纯度等定量指标来强化您的观察,因为可视化应被视为探索性工具而不是结论性证据。