named-entity-recognition 相关问题

命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等

处理短文本中的多个候选实体,以使用 SciSpacy 进行实体链接

我正在研究项目中使用 SciSpacy 将短文本链接到生物医学知识图谱 (UMLS CUI) 中的实体。目标是分析链接实体之间的关系...

回答 1 投票 0

NLP疾病检测

我正在开展一个项目,其目标是从不同的句子中检测疾病名称 我需要一些建议 我正在寻找可以获取疾病名称列表的图书馆...

回答 1 投票 0

为标记分类任务训练预训练的 BERT 模型时出现内存不足

我正在使用预训练的 BertForTokenClassification 来执行嵌套命名实体识别任务。为了定义嵌套实体,我使用多标签方法。在输出模型中返回 3 个 logit 列表...

回答 1 投票 0

为什么即使代码运行没有错误,Spacy 也不执行训练管道?

我正在使用 Spacy 版本 3.5.0 使用一些虚拟数据训练自定义 NER 模型。下面给出了我的整个代码和虚拟数据。这与此链接的第二部分中给出的代码完全相同。代码是

回答 1 投票 0

如何从简短的纯文本描述中导出属性/标签? (NER,法学硕士,?)

如何从简短的纯文本描述中导出属性/标签? (NER,法学硕士,?) 我有简短的产品描述,我想将其转换为结构化属性。 例子: 输入: “拉莱西亚亚

回答 1 投票 0

Google Colab 中的 ScispaCy

我正在尝试在colab中使用ScispaCy构建临床数据的NER模型。我已经安装了这样的软件包。 !pip 安装 spacy !pip 安装 scispacy !pip install https://s3-us-west-2.amazonaws....

回答 2 投票 0

从非结构化医疗笔记中提取复杂变量而不依赖预定义关键字的最佳 NLP 方法

我正在致力于从电子健康记录中的非结构化患者笔记中提取结构化数据。我一直在使用 SpaCy 的命名实体识别模型和实体标尺(来定义我的d...

回答 1 投票 0

NER 与 LLM 从文本中提取姓名、性别、角色和公司

由于版权原因,我需要从报纸文章中提取姓名、性别、职位和雇主/公司名称,并在本地硬件(不允许云)上运行该过程。 我玩过

回答 1 投票 0

Spacy 自定义名称实体识别 (NER)“灾难性遗忘”问题

模型无法记住之前训练的标签 我知道这是“灾难性的遗忘”,但似乎没有例子或博客可以帮助解决这个问题。 最常见的反应是...

回答 1 投票 0

我需要在标记化中使用命名实体识别(NER)吗?

我正在从事一个用于情感分析的 NLP 项目。我正在使用 SpaCy 来标记句子。当我阅读文档时,我了解了 NER。我读到它可以用来提取实体...

回答 1 投票 0

如何摆脱'nlp.max_length'限制?

我正在尝试使用 spacy 为文章进行自定义 NER;但是当我开始训练模型时,我收到错误消息: “[E088] 长度为 1021312 的文本超出最大值 1000000....” 尝试过

回答 2 投票 0

将初始输出导出为spacy的训练输入格式

我正在使用 INCEpTION 0.11.0 (https://inception-project.github.io/) 来注释我的训练数据。 我想使用 python spacy 来使用这个训练数据。 我可以在 Incept 中看到几种格式...

回答 1 投票 0


如何将 INCEpTION 带注释的文本 NER 转换为 spaCy? (CoNLL-U 到 json)

我正在使用 INCEpTION 来注释命名实体,我想用它来通过 spaCy 训练模型。 INCEpTION 中有多种选项(例如 CoNLL 2000、CoNLL CoreNLP、CoNLL-U)来导出注释...

回答 2 投票 0

PubTator API 未按预期返回会话号

当前正在尝试验证 PubTator 的命名实体识别 (NER) API 是否有效并返回预期的输出格式。我在 ht 下载了示例 Python 代码中包含的示例文件...

回答 1 投票 0

gensim 用于政治广告验证?

我正在尝试构建一个模型,使用转录的音频和屏幕文本将视频广告分类为政治或非政治,并提取候选人和赞助商的姓名。怎么可以...

回答 1 投票 0

如何在没有 IOB 标签的情况下使用 Hugging Face 的转换器管道重建文本实体?

我一直在寻找使用 Hugging Face 的管道进行 NER(命名实体识别)。但是,它以内部-外部-开始 (IOB) 格式返回实体标签,但没有 IOB 标签....

回答 4 投票 0

训练spaCy的NER的正确注释

我在寻找正确的方法来注释我的数据时遇到了一些麻烦。我正在处理与实验室测试相关的文本,并且使用以下标签: 1) 测试规格(如电压、长度...

回答 3 投票 0

spaCy 训练在 Google Colab 中自动停止

我正在自定义数据集上训练 spaCy 的 NER。 我已根据 spaCy 要求更改了数据集模板: 数据[0]['文本'] 收到契约登记册 密歇根州肯特县 2022 年 5 月 2 日下午 4:26 GU 51

回答 1 投票 0

Presidio 中的即时拒绝列表?

加载 Presidio 分析引擎需要一些时间。我想过滤掉特定名称,但我想过滤掉每个文档的不同名称。我不明白如何执行此操作...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.