nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

Trainer Huggingface - RuntimeError:无法固定“torch.cuda.FloatTensor”,只能固定密集的 CPU 张量

我最近遇到以下错误: RuntimeError:无法固定“torch.cuda.FloatTensor”,只能固定密集的CPU张量 在小型法学硕士上做 LoRA 时。 我在discord上看到有人说: 这是...

回答 1 投票 0

如何调整分词器的性能?

使用 Hugging Face 变压器库中的分词器。分词器在大多数情况下工作正常,但在某些情况下却不能。 我想知道我是否可以“调整”(不是训练......

回答 1 投票 0

由于改变批量大小的填充而导致嵌入变暗

我想训练一个简单的神经网络,它以 embedding_dim 作为参数: 类 BoolQNN(nn.Module): def __init__(self, embedding_dim): 超级(BoolQNN,自我).__init__() 选择...

回答 1 投票 0

如何使用 BERT 模型制作 t-sne 图

我有两个文本分类模型 https://huggingface.co/samanjoy2/banglaclickbert_finetuned_sequence_classification_clickbait https://huggingface.co/samanjoy2/

回答 1 投票 0

大型语言模型困惑

我目前正在使用 GPT-3,我正在尝试将其功能与我的硕士论文的相关语言模型进行比较。 不幸的是,GPT-3 是一个基于 API 的应用程序,所以我真的无法...

回答 1 投票 0

ML.NET 内部数组越界 - 我束手无策

我已经无计可施了…… T5.omnx - ML.Net 实现尝试深入文本摘要...... 拥有此文本线束 - 其内容如下 - 线束是组件可用性的简单证明....

回答 1 投票 0

如何使用 Sklearn 获取文本格式的词袋和词频?

我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...

回答 1 投票 0

使用spacy,如何从字符串中获取所有引理?

我有一个 pandas 数据框,其中有一列文本值(文档)。 我想使用 pandas apply 函数通过 spacy 库对这些值应用词形还原。 我已经定义了我的 to_lemma

回答 1 投票 0

如何从PDF研究论文中准确提取标题、标题和副标题?

我正在尝试从 PDF 格式的研究论文中提取标题、标题和副标题。我尝试了各种方法,但未能获得准确的结果。这是我采取的步骤...

回答 1 投票 0

如何使用BERT预测空字符串的概率

假设我们有一个这样的模板句子: “____房子是我们见面的地方。” 我们有一个形容词列表来填补空白,例如: “黄色的” “大的” ...

回答 2 投票 0

TTS 语音克隆

我使用了coqui的开源存储库来构建语音克隆模型。它利用使用 LJSpeech 数据集训练的不同 tts_model。我使用多语言模型来使用我...

回答 2 投票 0

打印文件中所有标有形态标签的标记

我想打印文件中所有带有形态标签的标记。到目前为止,我编写了如下所示的代码。 def 索引(文件路径,字符串): 进口再 模式=重新编译(r'...

回答 2 投票 0

Apertium + Python:词性标注器不提供表面形式

我正在尝试使用 Apertium 的标记器对意大利语中的一些句子进行词性标记。 虽然根据 Apertium GitHub 页面,除了形态之外,我还应该得到表面形式作为输出......

回答 1 投票 0

如何在sphinx中获取词形?

我如何获得单词的所有形态形式? 例如,搜索关键字为: 跑步者 结果应该是: 跑步,跑步...等等

回答 1 投票 0

在NLTK中,我可以对特定语言进行形态分析吗

我正在尝试在 NLTK 中添加一些阿拉伯语功能, 但有些任务(例如词干提取)需要词法分析。有没有办法定义特定语言的形态特征,例如......

回答 2 投票 0

如何使用postgresql构建morph字典?

我需要为自然语言创建特殊的形态词汇。每个单词应该包含一组特征。 PostgreSQL 9.* 在这种情况下有帮助吗?我的意思是:我应该创建表格...

回答 1 投票 0

增加搜索结果的相关性

我在使搜索输出对最终用户更实用方面遇到问题。问题与算法和方法有关,然后与要使用的确切技术或框架有关。 在...

回答 1 投票 0

如何在 Python 中绘制基于日语字符串的数据

我有一个像这样的csv: 约会,我,吃,鸡,你,鱼,香蕉 2014-9-14, 1, 2, 1, 1, 1, 0 2014-10-15, 1, 1, 1, 0, 0, 0 2014-11-13, 0, 1, 0, 1, 0, 1 忘记大小写和词干...

回答 1 投票 0

使用 *.dic *.aff 通过 Python 进行形态文本分析

我有 2 个 hunspell 格式的乌克兰语文件(.dic 和 .aff)。我的程序必须获取输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。我确实...

回答 2 投票 0

如何搜索字符串的不同时态?

我可以使用词干分析器、过滤器等。没问题。 但是这种情况呢,例如源文本包含短语: 狐狸跳了起来。 用户已输入:fox AND make 结果 = 0; 曲...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.