nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

AWS Lambda python:无法导入模块“lambda_function”:没有名为“regex._regex”的模块

我目前正在使用 AWS Lambda。以下是代码摘录: 将 pandas 导入为 pd 进口重新 导入nltk 从 stop_words 导入 get_stop_words 停用词 = get_stop_words('en') nltk.download('

回答 4 投票 0

在单词词典中确定英语词典中最流行的单词

如果我的措辞很糟糕,请原谅我,但我正在尝试找出如何从我制作的字典中的一组单词中确定英语中最常用的单词。我做了一些研究...

回答 1 投票 0

如何从NLTK导入和使用停用词列表?

我已经从 nltk.corpus 导入了停用词,但出现 STOPWORDS is not Defined 错误。下面是我的代码: 导入nltk 从 nltk.corpus 导入停用词 #创建停用词列表: 停用词=设置(STOPW...

回答 2 投票 0

使用 NLTK 和 Python 从自由文本中提取关键字/短语进行结构化查询

我想解释自由文本中的特定关键字,例如“我想从最近的餐馆订购煮鸡蛋和菠菜汤”,并使用它们从我的数据库中搜索内容。 例如...

回答 1 投票 0

如何使用Python创建多项选择聊天机器人

我想创建一个聊天机器人,它可以生成预定义的多项选择答案,如下图所示,就像是/否答案一样。 在此输入图像描述 经过互联网上的一些研究,我可以...

回答 3 投票 0

如何使用Python创建多项选择聊天机器人

我想创建聊天机器人,它可以生成预定义的多项选择答案,如下图所示,就像是/否答案一样。 在此输入图像描述 但经过一些互联网研究后,我...

回答 3 投票 0

如何从文档语料库/数据框列中的预先列出的一元语法中获取单词的二元语法/三元语法

我有一个数据框,其中一列中有文本。 我列出了一些需要分析的预定义关键字以及与之相关的单词(稍后制作词云和发生次数计数器......

回答 1 投票 0

为什么sklearn tf-idf向量化器给停用词最高分?

我用sklearn为nltk库中Brown语料库的每个类别实现了Tf-idf。有 15 个类别,每个类别的最高分都分配给停用词。 默认参数...

回答 2 投票 0

如果名字在句子中排在前面,Python NLTK 将姓氏识别为组织

我正在使用Python的nltk库从句子中提取名称。我期望输出为 ['Barack Obama', 'Michelle Obama'],但我得到的是 ['Barack', 'Michelle Obama']。我的示例代码如下...

回答 1 投票 0

如何从非结构化文本中提取特定实体

给定一个通用文本句子(在特定上下文中),如何使用 python 和任何 NLP 库提取属于特定“类别”的感兴趣的单词/实体? 例如给定...

回答 1 投票 0

定义相等谓词 Lambda 演算 nltk

我正在尝试定义单词“are”的 Lambda 演算表示,它是此 ccg 的等式谓词: ccg = ''' #CCG语法 # 完成词汇条目及其类别和

回答 1 投票 0

计算NLTK书籍包中文本的丰富度

我试图返回 NLTK 书中提供的 NLTK 文本的丰富性,但由于某种原因我没有得到任何结果。 有人可以解释一下我做错了什么吗? 从 nltk.book 导入 * 定义

回答 1 投票 0

Pyspark情感分析无效输出

我正在尝试对用例进行情感分析。大多数时候,它会给出正确的结果,但在某些情况下,即使是积极的评论也会被标记为消极的。我该如何修复我的设备...

回答 1 投票 0

下载 NLTK 数据时出现 SSL 错误

我正在尝试下载 NLTK 3.0 以与 Mac OS X 10.7.5 上的 Python 3.6 一起使用,但收到 SSL 错误: 导入nltk nltk.download() 我使用 pip3 命令下载了 NLTK: sudo pip3 install -U nl...

回答 5 投票 0

Good-Turing 平滑实现问题

我想实现 Good-Turing 平滑方法,这将改善我的语言模型。 让我们从理论开始(为简单起见,考虑一元模型)。 有一个语料库(例如精简版...

回答 1 投票 0

计算 pandas 数据框中单词的频率

我有一张如下表: URN 公司名称 0 104472 接收雅氏公司 1 104873 大建筑协会 2 109986 圣詹姆斯协会 3 114058

回答 5 投票 0

比较多个自然语言语料库的最佳方法是什么?

我一直在为一个研究项目做自然语言叙述报告的LDA主题模型(使用Gensim和Python)。我有几个小型语料库(每个语料库有 1400 到 200 个文档 - 我知道,那...

回答 2 投票 0

NLTK 条件频率分布与聚合

我正在尝试编写一个 NLTK ConditionalFreqDist,其中包含一些基于 fileid 中的数据的聚合字段。基本上,我有一个包含 DATE-TITLE 格式的 fileid 的文档语料库,例如......

回答 1 投票 0

如何计算召回率、精度和f-measure?

我正在从事一个情感分析项目。 我需要计算召回率、精度和 f 度量,但我不知道数据集的语法,如下所示: #火车数据格式,包含...

回答 1 投票 0

为什么即使代码运行没有错误,Spacy 也不执行训练管道?

我正在使用 Spacy 版本 3.5.0 使用一些虚拟数据训练自定义 NER 模型。下面给出了我的整个代码和虚拟数据。这与此链接的第二部分中给出的代码完全相同。代码是

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.