nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

在子弹和编号处拆分句子?

我试图将文本输入到我的文字处理器中,先分割成句子,再分割成单词。一段例子。当这一击被重复的时候,再加上幼稚的告诫... ...

回答 2 投票 1

我怎么能把实体(list)转换成字典呢? 我试过的代码被注释了,但不能用,NLP问题。

我怎么能把实体(list)转换为字典呢?我试过的代码被注释了,而且不工作,或者说我怎么能把实体改写成像字典一样?我想在字典中转换... ...

回答 1 投票 0

在python中创建(lemma, NER类型)的元组,Nlp问题。

我写了下面的代码,我做了一个字典,但我想创建元组的(lemma,NER类型)和收集计数的元组,我不知道如何做到这一点吗? 你可以请你帮助我吗?NER类型意味着...

回答 1 投票 0

nltk.download() Errno 61 和 Proxy 问题。

我在Python中导入nltk后,试图从nltk中下载包。它产生了以下错误信息。然后,我尝试了nltk.set_proxy,因为我正在使用中国的代理服务器。然而,我使用的代理 ...

回答 1 投票 0

为什么在NLTK中,"not "在英语中被认为是停顿词?

我目前正在学习python中的ltk,我正在做一个情感分析的程序,在做的时候我发现 "not , nor , never "被认为是停顿词,所以我的问题是......。

回答 1 投票 0

为什么在NLTK中,"not "在英语中被认为是停顿词?

我目前正在学习Python中的ltk,我正在写一个情感分析的程序。在工作的时候,我发现 "not,nor,never "被认为是停止词。所以我的问题是,为什么...

回答 1 投票 0

我将微博中的词限制为内容词,现在我想将这些词转化为小写,并添加带有下划线的POS。

我写了下面的代码,并将微博中的词限制为内容词,即名词、动词和形容词,现在我想将这些词转化为小写,并添加带有下划线的POS。...

回答 1 投票 0

如何在python中检查一个句子的开头是否有非英语单词?

我已经尝试了下面的代码来检查句子是否有非英语单词.但我想检查句子本身的开头是否有非英语单词,从而删除整个 ...

回答 1 投票 -1

我安装了tensorflow和tflearn来创建聊天机器人,在导入过程中显示错误。

这是我的代码 # NLP所需的库 import nltk nltk.download('punkt') from nltk.stem.lancaster import LancasterStemmer stemmer = LancasterStemmer() # Tensorflow所需的库 ...。

回答 1 投票 -1

读取特定的JSON列进行标记化。

我打算使用NLTK对JSON文件中的一列进行token化。下面的代码根据不同的时间间隔来读取和分割JSON文件。但是我很难让 "主文本"...

回答 1 投票 0

从给定的文本中识别出与领域相关的重要关键词。

我对NLP文本处理的领域比较陌生。我想知道如何从给定的文本中识别领域相关的重要关键词。例如,如果我要建立一个Q&A聊天机器人,它 ...

回答 1 投票 0

在punkt(".")处拆分段落列表。

我有一个段落列表:段落=['我不喜欢绿鸡蛋和火腿。我很饿,但我没有找到任何吃的东西','5.我不喜欢他们Sam-I-am。我是Sam.', 'Blah, Blah, Blah'] 我......。

回答 1 投票 0

按第一个字将 nltk.FreqDist 输出分组 (python)

我是一个有python基本编码能力的业余爱好者,我正在做一个数据框架,它有一列如下。其目的是将nltk.FreqDist的输出按第一个字分组,目前我所拥有的......

回答 1 投票 0

如何根据栏目来计算字数?

你好,我卡在这里了。我卡在这里。你能告诉我如何根据第二列的标签来计算单词吗?我想用.most_common()找到大部分使用的单词,使用分类:VB(Verb)中的most 10, ...

回答 1 投票 -1

如何使用NLTK从段落中删除重复的句子?

我有一个巨大的文档,其中有许多重复的句子,如(页脚文本,带字母数字字符的超链接),我需要摆脱那些重复的超链接或页脚文本。我已经尝试用下面的方法...

回答 1 投票 0

缺少一些没有用wordnet生成的形式的词。

参考这个链接,我试着从ltk.corpus import wordnet as wn forms = set() #我们将派生形式存储在一个集合中,以消除重复的......

回答 1 投票 0

按主题分类文本的日期标记化

我需要将以下列按日期标记为 Testo Giorno LE DESIGNAZIONI ARBITRALI DELLE SEMIFINALI DI RITORNO. 06022020 ...

回答 1 投票 1

专题分类

a_dict = { "Moods": { "快乐": ["好日子","快乐","高兴","幸福"],"伤心",["坏日子","心情不好","心情不好","心情不好"。["糟糕的一天", "心情不好", "不开心", "难过"] }, "季节":{ "冬天":["太冷","...

回答 1 投票 0

从数据框架中删除标点和句号。

我的数据框架看起来像--国文德里170千瓦330wp,发货和计费在德里... ... 古吉拉特邦4kw屋顶设置为家庭...

回答 1 投票 0

热门词

我有一个法语文本文件,我想计算其出现最多的单词,而不考虑停顿词。下面是代码:用open('.text_file.txt', 'r', encoding='utf8') as f: ...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.