nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

大型语言模型困惑

我目前正在使用 GPT-3,我正在尝试将其功能与我的硕士论文的相关语言模型进行比较。 不幸的是,GPT-3 是一个基于 API 的应用程序,所以我真的无法...

回答 1 投票 0

ML.NET 内部数组越界 - 我束手无策

我已经无计可施了…… T5.omnx - ML.Net 实现尝试深入文本摘要...... 拥有此文本线束 - 其内容如下 - 线束是组件可用性的简单证明....

回答 1 投票 0

如何使用 Sklearn 获取文本格式的词袋和词频?

我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...

回答 1 投票 0

使用spacy,如何从字符串中获取所有引理?

我有一个 pandas 数据框,其中有一列文本值(文档)。 我想使用 pandas apply 函数通过 spacy 库对这些值应用词形还原。 我已经定义了我的 to_lemma

回答 1 投票 0

如何从PDF研究论文中准确提取标题、标题和副标题?

我正在尝试从 PDF 格式的研究论文中提取标题、标题和副标题。我尝试了各种方法,但未能获得准确的结果。这是我采取的步骤...

回答 1 投票 0

如何使用BERT预测空字符串的概率

假设我们有一个这样的模板句子: “____房子是我们见面的地方。” 我们有一个形容词列表来填补空白,例如: “黄色的” “大的” ...

回答 2 投票 0

TTS 语音克隆

我使用了coqui的开源存储库来构建语音克隆模型。它利用使用 LJSpeech 数据集训练的不同 tts_model。我使用多语言模型来使用我...

回答 2 投票 0

打印文件中所有标有形态标签的标记

我想打印文件中所有带有形态标签的标记。到目前为止,我编写了如下所示的代码。 def 索引(文件路径,字符串): 进口再 模式=重新编译(r'...

回答 2 投票 0

Apertium + Python:词性标注器不提供表面形式

我正在尝试使用 Apertium 的标记器对意大利语中的一些句子进行词性标记。 虽然根据 Apertium GitHub 页面,除了形态之外,我还应该得到表面形式作为输出......

回答 1 投票 0

如何在sphinx中获取词形?

我如何获得单词的所有形态形式? 例如,搜索关键字为: 跑步者 结果应该是: 跑步,跑步...等等

回答 1 投票 0

在NLTK中,我可以对特定语言进行形态分析吗

我正在尝试在 NLTK 中添加一些阿拉伯语功能, 但有些任务(例如词干提取)需要词法分析。有没有办法定义特定语言的形态特征,例如......

回答 2 投票 0

如何使用postgresql构建morph字典?

我需要为自然语言创建特殊的形态词汇。每个单词应该包含一组特征。 PostgreSQL 9.* 在这种情况下有帮助吗?我的意思是:我应该创建表格...

回答 1 投票 0

增加搜索结果的相关性

我在使搜索输出对最终用户更实用方面遇到问题。问题与算法和方法有关,然后与要使用的确切技术或框架有关。 在...

回答 1 投票 0

如何在 Python 中绘制基于日语字符串的数据

我有一个像这样的csv: 约会,我,吃,鸡,你,鱼,香蕉 2014-9-14, 1, 2, 1, 1, 1, 0 2014-10-15, 1, 1, 1, 0, 0, 0 2014-11-13, 0, 1, 0, 1, 0, 1 忘记大小写和词干...

回答 1 投票 0

使用 *.dic *.aff 通过 Python 进行形态文本分析

我有 2 个 hunspell 格式的乌克兰语文件(.dic 和 .aff)。我的程序必须获取输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。我确实...

回答 2 投票 0

如何搜索字符串的不同时态?

我可以使用词干分析器、过滤器等。没问题。 但是这种情况呢,例如源文本包含短语: 狐狸跳了起来。 用户已输入:fox AND make 结果 = 0; 曲...

回答 1 投票 0

创建树形数据结构

我有一些数据: 一个 AXNHJNEHWXNOECMEJK DNFJNXYEEQWhsdbchjsxs XMJQWsdsEOJdfsKMDJE .... 每一行都是数组,每个字母都是对象。我有比较器函数,可以说字母 A 等于...

回答 2 投票 0

如何仅冻结一些带有绑定嵌入的嵌入索引?

我发现是否可以在pytorch中的嵌入层中仅冻结某些嵌入权重?一种仅冻结嵌入层的某些索引的好方法。 然而,虽然将其包含在...

回答 1 投票 0

如何将Stanza导出为ONNX格式?

如何将Stanza导出为ONNX格式? 仅仅简单地训练模型似乎是不可能的。

回答 2 投票 0

RNN 如何处理情感分析中的否定

我试图了解循环神经网络 (RNN)(例如 LSTM 或 GRU 模型或只是一个简单的 RNN)如何处理情感分析中的否定。具体来说,我很好奇这些模型如何

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.