我想想象一下使用LDA算法进行的主题建模。我使用名为“pyldavis”的python模块和jupyter笔记本作为环境。
import pyLDAvis.sklearn
...
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer)
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='mmds')
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='tsne')
它确实工作正常,但我真的不明白mds参数...即使阅读文档后:
mds:函数或函数的字符串表示
将topic_term_dists作为输入并通过2距离矩阵输出n_topics的函数。输出近似于主题之间的距离。有关默认函数的详细信息,请参阅js_PCoA()。如果为后两者安装了sklearn包,则字符串表示当前接受pcoa(或大写变体),mmds(或大写变体)和tsne(或大写变体)。
有人知道btw有什么不同吗? mds ='pcoa',mds ='mmds',mds ='tsne'?
谢谢!
我不是专家,但我遇到了同样的问题,在搜索关键词'pcoa','mmds','tsne'后,我了解到这些是降维的不同技巧。我猜'mds'代表'多维缩放'。
pyLDAvis使用此配置,同时在2D上绘制主题以确定其定位。