如果我的措辞很糟糕,请原谅我,但我正在尝试找出如何从我制作的字典中的一组单词中确定英语中最常用的单词。我对 NLTK 做了一些研究,但似乎找不到其中的函数(或任何其他库)来帮助我做我需要做的事情。
例如: 句子“我喜欢在炎热的一天喝一杯冷水”将返回“水”,因为它是该句子中日常对话中最常用的单词。本质上,我需要对话中最常用单词的返回值。
我想我可能必须涉及人工智能,但任何时候我尝试使用人工智能时我都会复制和粘贴代码,因为我只是不理解它,所以我试图避免走这条路
欢迎并感谢任何和所有帮助。
对于上下文,我决定启动一个项目,该项目本质上是根据用户所说的字符来猜测一个预定的单词,它有和没有,从计算机的猜测中。
这是一个使用词袋来获取文本语料库中最常见单词的示例,希望这会有所帮助
from collections import Counter
import re
# example text
text = """ She loves pizza, pizza is delicious. She is a good person. Good
people are the best."""
# Preprocess the text: remove punctuation and convert to lowercase
text = re.sub(r'[^\w\s]', '', text).lower()
# Tokenize the text into words
words = text.split()
#Create a Bag of Words model using Counter
bow = Counter(words)
# Retrieve the most common word
most_common_word, frequency = bow.most_common(1)[0]
print(f"The most common word is '{most_common_word}' with a frequency of {frequency}.")
希望这会有所帮助:)如果有请提出来