自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
Error.__init__() 在尝试加载 .keras 模型时遇到意外的关键字参数“trainable”
我训练了一个NER模型并将其保存为.keras文件,当我尝试加载模型时,它弹出这个错误 TypeError: 无法正确反序列化。请确保
我一直在尝试使用 Tensorflow 实现 Peephole LSTM,但出现以下错误 错误 下面是我的模型,我不确定为什么我无法在模型摘要中获取输入层 模型 和
如何使用 NLP 和 python 从文档中提取特定内容,例如姓名或出生日期?
我想从文档(例如简历)中提取非常具体的内容,例如姓名、地址和出生日期。假设我有 1000 个这样的文档,我想使用机器学习将其自动化......
我现在对深度学习还是新手,我按照这个 keras 教程使用 Transformer 制作翻译模型(这里是链接)。一切都很好,但我不知道如何保存...
我正在使用chatGPT 查询文本。但我需要 chatGPT 来回应单一的直接答案,而不是长篇故事或不相关的文本。有什么办法可以实现这个目标吗? 我的代码如下所示: 来自 langchain。
如何对未标记的数据进行情感分析,我查遍了互联网(给出了聚类算法),但效果不佳。如何对未标记的数据从头开始进行情感分析...
导入错误:无法从“transformers.utils”导入名称“_LazyModule”
我正在尝试运行文本摘要“t5-base”模型。该代码在我第一次运行时可以工作,但在安装/重新安装一些软件包后,它不再工作。有谁可以请...
我试图使用词袋模型构建一个基于内容的推荐系统。我下面的教程使用 sklearn 库中大小为 (4000,5000) 的向量的余弦相似度...
`AcceleratorState`对象没有属性`distributed_type`
我正在尝试使用以下代码将加速器与训练器一起使用: tokenizer = AutoTokenizer.from_pretrained(model_args.model_name_or_path) config = AutoConfig.from_pretrained(model_a...
Docker 构建时间过长且失败,requirements.txt 包含 TensorFlow 和其他包
我正在尝试构建我的 Docker 映像,但这需要很长时间。即使我让它继续构建,很长时间后它也会失败。这是我的 Dockerfile: 来自 ubuntu:24.04 # 安装Python并p...
在 python nlp 中删除窄“无间断空格”Unicode 字符 (U+00A0)
不间断空格被打印为空白,但在内部处理为 \xa0。如何一次删除所有这些字符? 到目前为止我已经直接替换了它: 文本 = 文本.replace('\u202f','') t...
我正在尝试执行文本分类任务,其中有大约 500 条餐厅评论的训练数据,这些评论被标记为 12 个类别。我花费的时间比实施 TF.IDF 的时间要长......
Transformer 语言模型的简单实现(例如此模型)定义 3 个矩阵 K、Q、V 来计算键、查询和值。然而矩阵 K 和 Q 永远不会单独使用:所有 Transformer
R 有一个 .txt 文件,我想从中提取数据作为字符串。我的 .txt 文件的格式如下,其中包含由数字分隔的列表。 1. [文本1] 2. [文本2] 3. [文本3] a...
微调的 openAI API 给出 NotFoundError:错误代码:404
这是我的第一个openAI微调工作,所以我了解的不多。我正在尝试微调 OpenAI API 以根据描述生成产品 ID。代码运行成功,还生成了mode...
BertForSequenceClassification 使用的是 CLS 向量吗?
拥抱脸源码中,使用了pooled_output =outputs[1]。 输出 = self.bert( 输入ID, 注意掩码=注意掩码, token_type_ids=
我正在尝试使用TextRank进行关键短语提取,我安装了3.3.0版本,nltk和en_core_web_trf在3.7.3上,我不知道这是否是问题。 这是我得到的错误 小鬼...
我的功能旨在创建一个包含三列的数据框;二元短语、计数(二元短语的)和 PMI 分数(二元短语的)。因为我想在大型数据集上运行它......
我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有 3-5 句话长。其中绝大多数的长度都不超过 500 字。我会...