nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

如何查找LangChain中Tool类的文本名称?

LangChain 文档指出,它提供了与各种服务和 API 的集成,以让代理与世界交互。这些代理大多可以在 langchain_community 或

回答 1 投票 0

在 TfidfVectorizer 标记化后删除二元组

我正在尝试删除 TfidfVectorizer 创建的二元组。 我正在使用 text.TfidfVectorizer,以便我可以使用自己的预处理器函数。 测试字符串和预处理器函数: 文档2 = ...

回答 1 投票 0

DSPy 无法检索 ChromaDB 中带有文本嵌入的段落

我正在开发一个使用 DSPy 和 ChromaDB 处理 pdf 文件的 RAG 应用程序。 首先,我从 pdf 中获取文本并将其作为块添加到 Chromadb 中。还添加了块的嵌入。还有...

回答 1 投票 0

word2vec 中 CBOW 和 Skipgram 梯度的区别?

为什么在 CBOW 中更新时会考虑大于或小于 MAX_EXP 的 f 值,而在 Skipgram 中会被忽略? 我专门研究了 word2 的 Google 实现...

回答 1 投票 0

C# 中的情感分析 API 语言俄语

您能否建议我的项目中使用的 API 符合以下标准: 。网 俄语 付费或免费版本 - 没关系 查了很多API,却找不到满意的...

回答 3 投票 0

如何获得更高的余弦相似度分数

我已经使用nltk清理了我的数据,并且我的数据非常干净,我仍然无法获得更高的相似度分数,我正在制作一个食谱推荐系统,它获取成分并返回一个食谱...

回答 1 投票 0

Polars/Spark/SQL 标准化表列中相似的公司名称

我有一个表,其中有一列公司名称。同一家公司可以以多种名称出现(例如“Ciao”、“Ciao Inc”、“Ciao Inc User”)。 我想以不同的名称提供同一家公司

回答 1 投票 0

nltk 对于 NLP 来说是一个好的 Python 库吗?

我是自然语言处理 (NLP) 的初学者,我不确定是否使用 TensorFlow 还是 NLTK 来完成我的 NLP 任务。两者似乎都是受欢迎的选择,但我不清楚哪一个更受欢迎

回答 1 投票 0

构建文本到表情符号转换器

我将如何创建一个文本到表情符号转换器。目标是创建一个应用程序,该应用程序接收日记条目并将其总结为一系列表情符号,我想确保使用

回答 1 投票 0

如何在 Python 中有效地将大型 .txt 文件拆分为训练集和测试集?

我有一个非常大的 .txt 文件(几 GB),我需要将其拆分为机器学习项目的训练集和测试集。通常的方法是将整个文件读入内存然后

回答 1 投票 0

深度学习文本摘要

我正在 Xl-sum 数据集的阿拉伯语部分微调 Mt5 模型 十个epoch,结果操作模型存储在拥抱人脸库中,训练有很好的结果......

回答 1 投票 0

根据可能句子的简单描述生成句子的最佳方法是什么?

我希望能够根据某些模式或规则生成句子。做这个的最好方式是什么?一种方法是编写一个解析器/分词器来读取模式并生成

nlp
回答 1 投票 0

确定文本是否为英文?

我正在使用 Nltk 和 Scikit Learn 进行一些文本处理。但是,在我的文件列表中,有一些文件不是英文的。例如,以下情况可能是正确的: [“t...

回答 8 投票 0

训练LLM执行文本分类

我正在尝试使用 GPTNeo 执行文本分类,使用 Huggingface 的 tweet_eval 数据集。我正在关注这个例子 https://huggingface.co/docs/transformers/tasks/sequence_classific...

回答 1 投票 0

导入错误:无法从“langchain_core.utils”导入名称“pre_init”

当我想从requirements.txt安装langchain库时,我得到 ImportError:无法从“langchain_core.utils”导入名称“pre_init” 我尝试从终端安装库...

回答 1 投票 0

如何在spaCy中处理很长的文档?

我正在尝试对西班牙语文本进行 NLP 分析。因此,为了进行词形还原,我使用 Spacy,因为 NLTK 没有西班牙语版本的引理。 Spacy 的问题是我有限制...

回答 2 投票 0

PyTorch 和 TensorFlow >= 2.0 均未找到。模型将不可用,只能使用分词器、配置和文件/数据实用程序

我正在尝试使用 pip 安装变压器 点安装变压器 进口变压器后 这个错误显示 PyTorch 和 TensorFlow >= 2.0 均未找到。模型将不可用...

回答 6 投票 0

无需 OpenAIEmbeddings 的检索增强生成

我正在玩 HuggingFace 和那里的一些模型。我正在努力实现 RAG 的目标。看起来像是一个非常清晰的指南,包含所有所需的成分和食谱。但是...

回答 1 投票 0

Spacy 自定义名称实体识别 (NER)“灾难性遗忘”问题

模型无法记住之前训练的标签 我知道这是“灾难性的遗忘”,但似乎没有例子或博客可以帮助解决这个问题。 最常见的反应是...

回答 1 投票 0

无限循环中推理模型时的 CPU 内存泄漏

我在运行一个在无限循环中使用各种 NLP 模型处理文本的 Python 脚本时遇到了 CPU 内存泄漏。该脚本包括语言翻译、情感分析以及...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.