我的数据集只有一行,即电影评论。我想执行情感分析,但如果不为电影评论分配标签,我就无法做到这一点。我需要帮助标记这些电影评论。我对 Weka 比较陌生。任何帮助将不胜感激。
我尝试使用 AffectiveTweets 包,它可以标记未标记的推文。但是,我打算使用的过滤器(即 LexiconDistantSupervision)只能根据表情符号标记推文。我需要帮助寻找可以标记我的电影评论的过滤器。或者也许是一种替代方法,以防我走错了路。预先感谢
您可以尝试从 IMDB 电影数据集构建模型,并使用该模型来标记未标记的数据集。
例如,带有 StringToWordVector 的 FilteredClassifier 和您选择的基分类器。随机森林应该是一个很好的起点。