自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
Pytorch:运行时错误:预计在开始新的迭代之前已完成前一次迭代的减少
我正在为情感分类任务训练多语言 bert 模型。我在 1 台机器上有 2 个 GPU,因此我使用 Huggingface Accelerator 进行分布式训练。但是当我运行代码时...
我使用 llama 2 创建了一个代码来对没有标签的文本进行分类,但问题是,它为所有语句输出一个类别。代码中的错误是什么? 文本和答案示例: 导入...
我正在处理包含生物医学实体的文本。然而 medspacy 软件包未能检测到这些: 进口医疗 nlp = medspacy.load() text =“患者接受了warfa治疗......
如何使用label studio对google colab中的文本数据进行注释?
如何使用label studio在google colab中注释文本数据?还请建议 label studio 的良好替代方案,我可以轻松地在 google colab 中使用它来注释/标记文本数据? 我...
我正在开发一个项目,使用 SBERT 预训练模型(特别是 MiniLM)进行 995 个分类的文本分类项目。我大多数情况下都遵循此处列出的步骤...
我想为文本制作一个分类器,进一步用于建议给定文本最相似的文本。 该应用程序的流程如下: 使用...
有没有办法将Google Colab代码转换为Web服务或Rest API
我有一个机器学习模块,它使用 Google Colab 的免费 GPU 来执行 NLP 任务,我想用它制作一个网络应用程序。我一直在考虑使用 React js 作为前端,使用 spring boot 来......
如何使用 llm 对象通过单个脚本使用 vLLM 在多个 GPU 上加载多个模型?
我尝试使用 vLLM 在单个 Python 脚本中将相同的模型加载到不同的 GPU 上,但在初始化第二个模型时遇到错误。 我正在尝试做的事情: 环境...
我正在尝试在colab中使用ScispaCy构建临床数据的NER模型。我已经安装了这样的软件包。 !pip 安装 spacy !pip 安装 scispacy !pip install https://s3-us-west-2.amazonaws....
AutoModelForSequenceClassification 损失没有减少
从数据集导入load_dataset 从 torch.utils.data 导入 DataLoader 从转换器导入 AutoTokenizer、AutoModelForSequenceClassification 进口火炬 从 tqdm 导入 tqdm 定义
我刚刚开始学习CRF++工具包的使用。 我下载了linux版本的CRF++ 0.54, 当我尝试使用命令编译 sdk/ 下的 example.cpp 时 g++ -o 示例 example.cpp
Seq2Seq trainer.train() 不断给出索引错误
我正在尝试使用 NLLB 模型进行从印地语到梵语的机器翻译。但我不断收到错误: IndexError:无效密钥:39463 超出大小 0 的范围。 当
Huggingface Pretrained 中 device_map = "auto" 的替代方案
我有一个使用以下代码从 Huggingface 读取的模型: 从变压器导入 AutoTokenizer、AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained(model_path) 模式...
这里的镜头有点远,对于缺乏信息,我深表歉意。然而,我现在甚至不知道该去哪里寻找。 所以我试图从一项虚构的调查中区分好的评论和坏的评论......
为什么我在 Kaggle 中提交笔记本时出现“笔记本内存不足”错误
我正在参加 Kaggle 比赛。在过去的7-10天里,我一直面临着一个特殊的问题。我正在尝试向竞赛提交作品,但收到“Notebook out of
我正在尝试开发一个正则表达式模式以在 for 循环中使用。我有两个列表 - 一个是文档中的一组清理后的关键字,另一个是我想使用清理后的文本来执行的一组标签...
我对 NLP 很陌生......有没有任何 API 或方法可以让我从句子中识别动词、形容词或副词? 我在项目中需要它吗?
我正在研究可汗学院的练习框架,更具体地说,是应用题。 在做应用题练习时,学生经常会遇到同样的应用题,只是数字和名字......
Transformers // 根据之前交易的序列预测下一个交易 // Sequence2One 任务
我们正在解决以下任务。 我们公司有一系列的活动,例如 数据: 1000 美元 / 橙子 / 上午 11 点 500$ / 洗车 / 下午 3:00 15$ / 鲜花 / 晚上 9 点 任务: 任务是 - 预测下一步