我是否同时对来自两个不同模型的两组嵌入进行 t-SNE 拟合，还是分别拟合每个嵌入然后进行可视化和比较？

Question

我有来自两个不同 GNN 的两组嵌入。我想通过可视化来比较嵌入，我想知道哪种方式是最合适的比较方式。我是否为每组嵌入分别拟合 t-SNE 然后使用散点图？或者我是否将它们全部放入一个 t-SNE 中？

Answer 1

如果为每个嵌入集分别拟合 t-SNE，则将保留每个嵌入空间的内部结构，因为优化是独立的。然而，这种方法的散点图不能直接比较，因为 t-SNE 输出是不确定的，并且嵌入空间可以任意旋转、翻转或缩放。虽然您可以单独检查集群，但您无法深入了解两个嵌入集之间的关系。

如果将两个嵌入集上的 t-SNE 拟合在一起，嵌入将被投影到共享的低维空间中。这样可以进行直接的视觉比较，从而更容易观察两个 GNN 的嵌入是否相似。然而，这种方法存在扭曲各个嵌入空间的内部结构的风险，特别是当嵌入差异很大时。 t-SNE 算法将平衡两个集合之间和内部的关系，可能会引入伪影。

选择取决于您的目标。对于内部结构的独立分析，单独拟合 t-SNE。对于共享空间中的关系比较，联合拟合 t-SNE。

为了补充可视化，您最好包括余弦相似度或聚类纯度等定量指标来强化您的观察，因为可视化应被视为探索性工具而不是结论性证据。

我是否同时对来自两个不同模型的两组嵌入进行 t-SNE 拟合，还是分别拟合每个嵌入然后进行可视化和比较？

问题描述投票：0回答：1

1个回答

最新问题

我是否同时对来自两个不同模型的两组嵌入进行 t-SNE 拟合，还是分别拟合每个嵌入然后进行可视化和比较？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1