Python:来自WordCloud的字数统计

问题描述 投票:-1回答:1

我正在文本正文上使用WordCloud,我想查看云中每个单词的实际计数。我可以使用.words_查看加权频率,但我想知道是否有一种简单的方法来查看实际计数?

# Generate a word cloud image
wordcloud = WordCloud(background_color="white").generate(text)
wordfreq = wordcloud.words_

编辑:之所以我希望能够从WordCloud中查看字数统计(相对于自己从文本中查找字数统计字数的原因)是因为WordCloud在其分析中包括短语(并置)以及单个单词。因此,例如,将出现“水资源”的计数,以及当单词“水”未出现在“水资源”中时的计数。 WordCloud似乎也将以复数形式出现的单词实例添加为单数形式的单词计数(例如,将“ watersource”计数为“ water resources”)。

python word-cloud
1个回答
0
投票

只需使用WordCloud().process_text(text)

>>> WordCloud().process_text('penn penn penn penn penn state state state state uni uni uni college college university states vice president vice president vice president vice president vice president vice president vice president')
{'penn': 5, 'state': 5, 'uni': 3, 'college': 2, 'university': 1, 'vice president': 7}

注意,它将“州”合并到“州”计数中,并且也将“副总统”视为一个二元组。

© www.soinside.com 2019 - 2024. All rights reserved.