nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

使用 for 循环为标记及其模型分数制作一个 Python 字典

所以我试图制作一个Python字典,其中包含一个单词及其文件中所有单词的模型分数。我的问题是我找不到一种方法来放置迭代器、单词、int 的关键字...

回答 1 投票 0

尽管成功下载资源,WordNet Lemmatizer 的 NLTK 中仍出现查找错误

我正在 Kaggle 笔记本中执行文本处理任务,并在使用 NLTK 的 WordNetLemmatizer 时遇到查找错误。尽管我努力下载所需的 NLTK 资源,但错误仍然存在...

回答 1 投票 0

返回由Python字典组成的元组的函数

我正在尝试创建一个函数,该函数获取用于评论的标记化单词列表和标签,并返回由 Python 字典和关联标签组成的元组列表。 你可以看到什么...

回答 1 投票 0

返回由Python字典组成的元组的函数

我正在尝试创建一个函数,该函数接受用于评论和标签的标记化单词列表,并返回由 python 字典和关联标签组成的元组列表。 你可以看到什么...

回答 1 投票 0

C#而不是Python中的英文文本标记化是可能的吗?

在我们的软件中,我们必须分析纯文本文件。首先,我们应该将文本分成段落,然后分成句子,然后分成标记。最后的步骤(据我所知)是词干和

回答 1 投票 0

在 Iron Python 中使用 NLTK 库

我正在尝试使用 NLTK 库并使用 Iron Python 导入它。我无法完成此操作,并且报告错误说找不到该库。请让我知道可能是什么...

回答 1 投票 0

如何列出所有从nltk下载的数据集

我使用从 nltk 下载了一些数据集 导入nltk 导入nltk.语料库 nltk.download() 现在我想列出所有下载的数据集 我不知道怎么办。

回答 2 投票 0

NLTK 中解析的英语语法

是否有现成的英语语法可以加载并在 NLTK 中使用?我搜索了使用 NLTK 解析的示例,但似乎我必须在之前手动指定语法

回答 9 投票 0

NLTK RegEx Chunker 未使用通配符捕获定义的语法模式

我正在尝试使用 NLTK 的 POS 标签作为正则表达式来对句子进行分块。定义了 2 条规则来根据句子中单词的标签来识别短语。 主要是,我想捕捉...

回答 1 投票 0

匹配标点符号或行尾

我想改进 NLTK 句子标记器。不幸的是,当文本在句号和下一个句子之间没有留下任何空格时,它的效果就不太好。 从 nltk.tokenize 导入

回答 1 投票 0

如何解决 AttributeError: 'float' 对象没有属性 'encode'

这是代码 将 pandas 导入为 pd 将 numpy 导入为 np 将 matplotlib.pyplot 导入为 plt 将seaborn导入为sns plt.style.use('ggplot') 导入nltk df = pd.read_csv('/kaggle/input/starbucks-review...

回答 1 投票 0

如何解析搜索引擎输入的关键词

我正在实现一个工具,可以让用户搜索文本中的术语。我目前专注于处理来自搜索的更复杂的输入。 我希望支持的运营商是: | = 或 & = ...

回答 1 投票 0

NLP 速记到普通的转换

使用 NLP 将速记文本转换为普通文本有哪些方法?例如“snr engr”到“高级工程师”? 我在网上找到的大多数文章都涉及使用预定义的简短字典...

回答 1 投票 0

Python NLTK - 根据按标签返回最高结果来计算棕色语料库中单词的出现次数

我正在尝试从特定标签的语料库中返回出现次数最多的值。 我可以让标签和单词本身很好地返回,但是我无法让计数在输出中返回。

回答 2 投票 0

如何在python nltk和wordnet中获取单词/同义词集的所有下位词?

我有 WordNet 中所有名词的列表。我想删除所有不是车辆的名词。我该怎么做?下面是我想要制作的伪代码,但我不知道如何使其工作: 为了...

回答 2 投票 0

使用 Python3 的 Visual Studio Code 获取 nltk 证书验证失败错误

我收到此错误。正如你所看到的,我按照他们的指南在我的代码中导入了 nltk 和 nltk.download : [nltk_data] 加载单词时出错: 我收到此错误。正如你所看到的,我按照他们的指南在我的代码中导入了 nltk 和 nltk.download 。: [nltk_data] Error loading words: <urlopen error [SSL: [nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed: [nltk_data] unable to get local issuer certificate (_ssl.c:1000)> 我的代码: import re # To remove regular expressions. Like ? ! . , import tkinter as tk # This is a graphical UI from tkinter.scrolledtext import ScrolledText # Widget import nltk nltk.download('words') # Check wether a word is valid from nltk.corpus import words class SpellingChecker: def __init__(self): self.root = tk.Tk() # tk.Tk refers to a class within the Tkinter module, which is a standard GUI self.root.geometry("600x500") self.text = ScrolledText(self.root, font=("Helvetica", 14)) self.text.bind("<KeyRelease>", self.check) # To check words whenever we release a key self.text.pack() self.old_spaces = 0 # By default we have 0 whitespaces self.root.mainloop() # To get the GUI running def check(self, event): content = self.text.get("1.0", tk.END) # 1.0 is the first character, 1.1 is the second character, 1.2 is the third character etc. # tk.END this gives the full content of the text box space_count = content.count(" ") # Count the white spaces if space_count != self.old_spaces: # If space count is not the same, != as self.old_spaces self.old_spaces = space_count for tag in self.text.tag_names(): self.text.tag_delete(tag) for word in content.split(" "): if re.sub(r"[^\w]", "", word.lower()) not in words.words(): position = content.find(word) self.text.tag_add(word, f"1.{position}", f"1.{position + len(word)}") self.text.tag_config(word, foreground="red") SpellingChecker() 我使用的是 MacOS,并且安装了 Python3。 寻找答案。 我尝试重新添加它们,例如nltk3,检查论坛,视频。什么也没有。 使用VPN,然后在顶部添加一些证书代码。

回答 1 投票 0

NLTK 中 PDF 错误的短语和字数统计

要搜索的短语列表 要搜索的短语 = [ “人工智能”, “机器学习”, “神经网络” ] # 搜索短语并获取计数

回答 1 投票 0

属性错误:模块“numpy.linalg._umath_linalg”没有属性“_ilp64”

在 google colab 上运行此代码块。 “import nltk”导致了这个问题。 错误说明: /usr/local/lib/python3.10/dist-packages/numpy/testing/_private/utils.py 中 ...

回答 1 投票 0

NLTK 包不在生产中工作,但在开发中工作

我使用 Django 创建了一个网络应用程序。我想在这个网络应用程序中添加从内容中提取短语的功能。我的代码在开发中运行良好,但在生产中却无法运行。使用 nltk p...

回答 1 投票 0

如何优化这个功能,提高运行时间?

我的功能旨在创建一个包含三列的数据框;二元短语、计数(二元短语的)和 PMI 分数(二元短语的)。因为我想在大型数据集上运行它......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.