nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

如何优化这个功能,提高运行时间?

我的功能旨在创建一个包含三列的数据框;二元短语、计数(二元短语的)和 PMI 分数(二元短语的)。因为我想在大型数据集上运行它......

回答 1 投票 0

将多个句子传递给BERT?

我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有 3-5 句话长。其中绝大多数的长度都不超过 500 字。我会...

回答 1 投票 0


为什么当测试的字符串100%包含查询字符串时,fuzzywuzzy的process.extractBests没有给出100%的分数?

我正在测试fuzzywuzzy的process.extractBests()如下: 来自 fuzzywuzzy 导入过程 # 定义查询字符串 查询=“苹果” # 定义选择列表 选择= [“苹果&...

回答 1 投票 0

NLTK 与距离度量一致

我的任务是计算多标签分类中注释者间的一致性,其中每个示例可以分配多个标签。我发现 NLTK 可以根据差异来衡量一致性...

回答 2 投票 0

从T5ForConditionalGeneration确定decoder_hidden_states的内容

我正在使用 Huggingface T5ForConditionalGeneration 模型,无需修改。 我想计算 T5 解码器最后一个隐藏状态的平均池化,但我无法确定

回答 1 投票 0

R 中的 FastText language_identification 返回太多参数 - 如何匹配文本?

FastText language_identification 返回每个原始文本的多个预测,并且也无法指示哪个属于哪个原始文档。 每个

回答 1 投票 0

Transformer:无法从“transformers”导入名称“AutoModelWithLMHead”

我指的是stackoverflow的这个答案,但我无法得到有关我的问题的任何线索:[https://stackoverflow.com/questions/63141267/importerror-cannot-import-name-automodelwithlmhead-from-

回答 3 投票 0

Android 机器学习库

我正在尝试为我的 Android 应用程序构建一个小型文本挖掘工具。我正在检查一个机器学习库,它可以让我进行聚类、分类等。 有没有机器学习库

回答 3 投票 0

如何在短时间内构建准确的数据集?

我们正在开发一款 iOS 应用程序,让用户可以发送可定制的数字卡片。用户可以从各种卡片模板中进行选择,输入自己的文本,并根据自己的喜好对卡片进行编辑。我们也有...

回答 1 投票 0

“寻求 Python 中高效 EDA 和大型数据集可视化的先进技术”

在提高数据分析和可视化技能的过程中,我一直在探索各种技术和工具来更有效地处理大型数据集。我一直在使用 Python、Pandas 和

回答 1 投票 0

即使output_attentions= True也没有返回Attention

我正在使用基于预训练模型的 BERT(github 链接:DNABERT-2) 它使用AutoModelForSequenceClassification和mosaicml/mosaic-bert-base。 我遇到的问题是我无法吸引注意力。我

回答 1 投票 0

Flan-T5 参数说明

这是一个一般性指导问题。我想清楚地解释一下 Flan-T5 的 2 个参数: 最长长度 返回序列数 另外 flan-t5 的输入限制是多少?

回答 1 投票 0

判断一个单词是否是名词

给定一个输入单词,我想确定它是否是名词(如果有歧义,例如cook可以是名词或动词,则该单词必须被识别为名词)。 其实我用的是POS

回答 4 投票 0

使用 vllm 提取嵌入

下面是一小段代码,用于从LLM的某一层中提取嵌入: def process_row(提示:str,模型,分词器,layers_to_use:列表,remove_period:bool): ”“”...

回答 1 投票 0

是否有模型或算法可以从纯文本中提取自定义标签和关键细节

我在 azure 中有一个 blob(pdf),我将使用 OCR 从中提取文本,然后得到一个字符串作为结果。现在我想分析这段文本,以便我可以根据上下文来标记文档...

回答 1 投票 0

匹配不同语言中包含“and”和&符号的字符串

假设在2个不同的数据框df1,df2中我有2列 df1['电影'] = pd.Series(['比维斯与巴特海德', '邦妮与克莱德', '亚当与夏娃']) df2['电影'] = pd.Series(['Beavis und Butthea...

回答 1 投票 0

为什么我的单词词形还原没有按预期工作?

stackoverflow 社区大家好! 长期读者,但第一次发帖。我目前正在尝试 NLP,在阅读了一些涉及该主题的论坛帖子后,我似乎无法理解引理...

回答 1 投票 0

NefTune 在 Transformers 上收到 0 训练损失

我基本上是在尝试使用 Neftune 微调我的模型。模型基于土耳其语言。但在那里我的训练损失为零。我尝试过另一种模型,例如土耳其-GPT2,但没有...

回答 1 投票 0

修复错误“当n_samples = 0,test_size = 0.1和train_size = None时,生成的训练集将为空。调整上述任何参数。”

我用python编写了一个程序,我想通过BERT算法实现NLP。我有一个数据集和下面的代码,但是当我在colab运行该程序时,我遇到了以下错误 将 numpy 导入为 np 导入

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.