有没有办法使用NLTK / Python生成一串N个随机英语单词?
我知道NLTK能够根据输入文本和语法生成句子,但我不需要根据任何类型的语法生成句子 - 我只需要从给定的词典/词汇中随机选择N个单词,并连接他们成了一个字符串。我也知道能够生成随机字符串或如何使用NLTK使用n-gram生成“看起来像英语”的无意义单词,但我需要将这些单词作为某些字典文件中的实际英语单词。
我试过这样做:
from nltk.corpus import words
from random import sample
n = 100
rand_words = ' '.join(sample(words, n))
但是words
不是可迭代的,所以我不能这样使用它。使用NLTK的内置词典创建随机英语单词串的正确方法是什么?
你只需要使用words()
函数corpus-structure
rand_words = ' '.join(sample(words.words(), n))