我是NLP的新手,我想知道通过考虑从Word2Vec检索到的Word嵌入和已经使用的主题词分布来总结已经通过LDA等方法分类到某个主题的文档是否是个好主意生成后,想出一个句子评分算法。这听起来像是创建文档摘要的好方法吗?
我想建议你这个post。
您可以使用Google或Facebook中预先训练好的Word2Vec模型(检查FastTest文档,了解如何解析第二个模型或选择其他语言),而不是在步骤4中使用Skip-Thought Encoder。
通常,您将有以下步骤:
我希望它会有所帮助。祝好运! :)