named-entity-recognition 相关问题

命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等

训练spaCy的NER的正确注释

我在寻找正确的方法来注释我的数据时遇到了一些麻烦。我正在处理与实验室测试相关的文本,并且使用以下标签: 1) 测试规格(如电压、长度...

回答 3 投票 0

spaCy 训练在 Google Colab 中自动停止

我正在自定义数据集上训练 spaCy 的 NER。 我已根据 spaCy 要求更改了数据集模板: 数据[0]['文本'] 收到契约登记册 密歇根州肯特县 2022 年 5 月 2 日下午 4:26 GU 51

回答 1 投票 0

Presidio 中的即时拒绝列表?

加载 Presidio 分析引擎需要一些时间。我想过滤掉特定名称,但我想过滤掉每个文档的不同名称。我不明白如何执行此操作...

回答 1 投票 0

如何部署spacy ner模型和fastapi

我有一个自定义的 spacy ner 模型广告 fastapi,在本地计算机中运行时工作正常。但是当我尝试将它部署在铁路中时,它崩溃并产生错误,就像它无法访问 s 中的模型一样......

回答 1 投票 0

用于 NER 训练的 SpaCy GPU 内存利用率

我的训练代码: spacy.require_gpu() nlp = spacy.blank('en') 如果 'ner' 不在 nlp.pipe_names 中: ner = nlp.add_pipe('ner') 别的: ner = nlp.get_pipe('ner') 文档 = 加载数据(

回答 1 投票 0

Error.__init__() 在尝试加载 .keras 模型时遇到意外的关键字参数“trainable”

我训练了一个NER模型并将其保存为.keras文件,当我尝试加载模型时,它弹出这个错误 TypeError: 无法正确反序列化。请确保

回答 1 投票 0

如何获取每个 Spacy NER 实体的描述?

我正在使用 Spacy NER 模型从文本中提取一些与我的问题相关的命名实体,例如日期、时间、GPE 等。 例如,我需要识别以下时区

回答 3 投票 0

从 json 文件创建 BIO 格式的句子 - 训练 NER 模型

我有一个 JSON 文件,将用作 NER 模型的数据。 它有一个句子和该特定句子中的相关实体。 我想创建一个函数来生成 BIO 标记的字符串...

回答 1 投票 0

是否有模型或算法可以从纯文本中提取自定义标签和关键细节

我在 azure 中有一个 blob(pdf),我将使用 OCR 从中提取文本,然后得到一个字符串作为结果。现在我想分析这段文本,以便我可以根据上下文来标记文档...

回答 1 投票 0

自定义名称实体识别

我有以下一句话: text="英格兰的天气极其恶劣" 我想要执行自定义名称实体识别 (NER) 过程 首先,正常的 NER 程序将输出

回答 2 投票 0

Pytesseract 返回边界框内的文本

我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...

回答 1 投票 0

从 spaCy 中的句子中提取日期

我有一个像这样的字符串: “日期为2019年6月30日至2022年1月1日(含)” 我想使用 spaCy 从此字符串中提取日期。 到目前为止,这是我的功能: 定义

回答 1 投票 0

如何使用SpaCy NER?

我正在开发一个小型项目,将相似的句子聚集在一起。在实现这一目标之前,我必须对极其脏的数据进行预处理(这些数据都是用户输入的,免费...

回答 1 投票 0

如何从Spacy NER模型获得每个实体的预测概率?

我使用这个官方示例代码使用我自己的训练样本从头开始训练 NER 模型。 当我在新文本上使用此模型进行预测时,我想获得每个

回答 3 投票 0

当我尝试在本地电脑上运行经过训练的 ner 模型时出错

重新导入 进口泡菜 导入keras 将张量流导入为 tf 从 keras.models 导入顺序 从 keras.layers 导入 TFSMLayer 将 numpy 导入为 np 类 CustomNonPaddingTokenLoss(keras.losses....

回答 1 投票 0

SpaCy v3 自定义 NER 模型训练

我正在尝试使用 spacy 和 python 创建一个从文本中提取实体的 NLP 项目。 我需要一些自定义实体,因此我创建了一个带有注释文章的 JSON 文件,我用它来训练我的...

回答 1 投票 0

使用 Python 进行搜索引擎查询的命名实体识别

我正在尝试使用Python对搜索引擎查询进行命名实体识别。 搜索引擎查询的一个重要问题是它们通常不完整或全部小写。 为了这个任务,我...

回答 1 投票 0

SpaCy:正则表达式模式在基于规则的匹配器中不起作用

我正在尝试定义一个正则表达式,用作我的 spaCy 模型中实体标尺组件中的文本模式。 目的是每当发现单词结构时添加带有“COMP”标签的标记...

回答 1 投票 0

AttributeError:“TokenClassifierOutput”对象没有属性“detach”

您能帮我解决以下错误吗:'TokenClassifierOutput'对象没有属性'detach'即使修改了像output = model(input_ids,

回答 2 投票 0

NER中如何处理不平衡数据集?

我现在正在使用NER进行信息提取。我的数据集领域(主要)是计算机科学。它包含标签/标记:“TUJUAN”、“METODE”和“TEMUAN”。问题是

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.