词性标注器或POS标记器是算法的具体实现,其根据一组描述性标签(例如将词语识别为名词,动词)将离散词语以及隐藏词性相关联。 ,形容词,副词等。它通常遵循基于机器学习(ML)技术的方法。
Apertium + Python:词性标注器不提供表面形式
我正在尝试使用 Apertium 的标记器对意大利语中的一些句子进行词性标记。 虽然根据 Apertium GitHub 页面,除了形态之外,我还应该得到表面形式作为输出......
当使用解析器或核心 NLP 中的任何注释时,有没有办法访问概率或误差幅度? 为了将我的问题放在上下文中,我试图理解......
我尝试了不同的教程来学习在 Python 中使用斯坦福词性标注器。目前,我正在使用斯坦福标记器使用以下代码进行词性标记。然而,我得到了
我正在使用 nltk 通过首先删除给定的停用词来从句子生成 n-gram。然而,nltk.pos_tag() 非常慢,在我的 CPU(Intel i7)上最多需要 0.6 秒。 输出: ['第一个...
我正在尝试使用 PET 解析器,但给定的使用文档不够。谁能给我推荐一篇关于使用 PET 的好文章或教程?支持UTF-8吗?
我正在尝试使用 spaCy 从文本中提取特定信息。 因此,我需要配置一个自定义标记器来识别它们,并配置一个自定义标记器来标记外部词典中的所有单词...
几个月前正在使用这个 POS 标记模型,没有出现任何问题。 最近再次尝试,但模型未加载。 请帮忙!!!!!!! 尝试加载模型,但显示相同的错误。 尝试过...
Hazm:POSTagger():ArgumentError:参数2:<class 'TypeError'>:类型错误
我运行以下代码时出错。你可以给我一些帮助吗? 从 __future__ 导入 unicode_literals 从危险进口* tagger = POSTagger(model='resources/postagger.model') 标记者....
我正在尝试使用 spaCy 中的英语模型来检测处于祈使语气的动词,但我发现形态特征与形态学中发现的示例不一致
使用 bert-base-ner 提取公司名称:了解哪些词与哪些词相关的简单方法?
嗨,我正在尝试使用 bert-base-ner 从有关公司的字符串描述中提取完整的公司名称。我也愿意尝试其他方法,但我真的找不到。问题是
我正在探索一小部分文本,我正在做的其中一件事是检查与各种主题相关的动作。我已经盘点过多少次了,比如“man...
我需要将 nltk.pos_tag() 与双字母组合一起使用,这是我的代码: 从 nltk.util 导入 ngrams 从集合导入计数器 bigrams = list(ngrams(all_file_data, 2)) 打印(二元组[:50]) 打印(
在NLP中,是否有公认的策略来获取与一个人或一个地方相关的形容词(或一个人或一个地方的一般印象)?
我熟悉部分语音标签(POS-tag),但即使是这种元论也不显得小题大做。
我试图用Spacy来做西班牙语的pos标签,为此我查阅了官方文档,也阅读了Stackoverflow上的各种帖子,但都没有成功。我有...
我需要找到网站上某些评论的观点。我为此使用了sendiwordnet。我首先将包含所有评论的文件发送到POS Tagger。还有其他准确的方法吗...
将collections.counter对象的熊猫系列转换为熊猫数据框的许多列
我在每行中都有一系列collection.counter对象。像这样:0 {'PRP $':1,'NNS':1,'VBP':1,'DT':3,'NN':... 1 {'JJS':1,'NN':4 ,'IN':1,'JJ':1} 2 {'DT'...
正如subj行所说,我正在尝试根据单个POS标签提取noun_chunks的元素。似乎noun_chunk的元素无法访问全局语句POS标签。到...
我正在使用NLTK POS标记器,如下所示send1 ='get me now'send2 ='run fast'tags = pos_tag(word_tokenize(sent2))打印标记[('run','NN'),('fast', 'VBD')]我发现了类似的帖子NLTK认为...
我正在使用hazm以便使用python 2.7提取文本中的块(由于库兼容性,使用了旧版本的python)在一行中,我必须引用一个名为postagger.model的模型...] >
我想为每个句子找到一个主语,动词和宾语,然后将其传递给自然语言生成库simpleNLG以构成一个句子。我尝试了多个库,例如Cornlp,...