named-entity-recognition 相关问题

命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等

有没有更快的方法来处理 pandas 字符串值列表

给定列大约有 13000 个值。下面的函数的工作方式是,输入是字符串列表,并对列表中的每个单词进行 NER 标记。平均有

回答 1 投票 0

Spacy NER 无法识别姓名

任何人都可以帮我理解为什么 Spacy NER 拒绝识别句子中的最后一个名字“Hagrid”,无论使用什么模型(sm、md、lg)?: “赫敏买了一辆车,然后赫敏都……

回答 1 投票 0

在函数注册表“architectures”中找不到函数“spacy-transformers.TransformerModel.v3”

我试图创建一个自定义 NER 模型。我使用 spacy 库来创建模型。这行代码是从base.config文件创建配置文件。 我的代码是: !python -m spacy ...

回答 4 投票 0

Token分类模型测试中的奇怪结果 - CamemBERT

我正在使用基于卡门贝尔的模型和Pytorch进行NER任务进行微调,获得的模型目前没有给出好的结果,但至少给出了一些句子的标签

回答 2 投票 0

NLP、NER --> python 提取个人信息(如名字、姓氏、财务代码)

我正在开发一个从自定义文档中提取个人信息的项目。特别是,我有一个 txt 文件,其中包含很多姓名和信息,但我想提取姓名和

回答 1 投票 0

我的 IndoBERT 模型出现 ValueError:该模型没有从输入中返回损失,仅返回以下键:last_hidden_state

我试图用我的数据集微调我的 IndoBERT 模型。当我使用 BERT base-uncased 时,它起作用了。但当我要用 IndoBERT 来做这件事时,它又回来了 -------------------------------------------...

回答 1 投票 0

pytorch 未检测到 GPU 的 spacy NER

我正在尝试训练 spacy3 NER 模型。我的机器上有可用的 GPU,规格如下: +------------------------------------------------ ----------------------------+ | NVIDIA-SMI 515.86...

回答 1 投票 0

将 json 文件格式更改为 .spacy 以进行自定义 NER 标记

我想为我的项目创建一个自定义标签。为了获得有关此主题的帮助,我浏览了本教程的使用 spaCy 3.0 构建自定义 NER 模型。 JSON 文件的包含内容 [{“文本”:&q...

回答 1 投票 0

如何在 Spacy 中重复模式

我想编写一个 Spacy 模式来匹配作者姓名。例如,“史密斯、约翰、琼斯、鲍勃”。但逗号可以是分号。我想我想要的模式是: 作者模式 = [ {“

回答 1 投票 0

如何修改或重新训练现有的OpenNLP模型?

有什么方法可以重新训练现有的 OpenNLP 模型吗?即从 OpenNLP 向现有模型添加新项目? 假设我想向现有的 en-ner-date.bin 添加一些新条目,因为有些...

回答 1 投票 0

Spacy v3 DocBin 无法保存 train.spacy 字节对象太大

我想在 spacy v3.0+ 中训练大数据 有 8000000 个数据令牌计数 我每个块做了 1000000 个,最后 murge vai DocBin python 代码但出现错误 导入操作系统 导入spacy 来自太空。

回答 1 投票 0

无法从 Python 脚本创建和运行 Azure ML Text NER 作业

我正在尝试从 Python 脚本触发 Azure ML 服务上的文本 NER 作业,并将训练和验证文件夹从本地路径上传到数据存储上。代码如下: 导入操作系统 来自

回答 1 投票 0

如何应用huggingface中的预训练变压器模型?

我有兴趣使用 Hugging Face 的预训练模型来执行命名实体识别 (NER) 任务,而无需进一步训练或测试模型。 Hugging Face的模特页面上,唯一

回答 2 投票 0

如何让spaCy大小写不敏感

如何在查找实体名称时使 spaCy 不区分大小写? 是否有任何我应该添加的代码片段或其他内容,因为问题可能会提到非大写的实体...

回答 2 投票 0

用于 ML 预测的 NER(命名实体识别)的 CUDA 问题

我正在尝试使用 NamedEntityRecognition (NER)(https://github.com/dotnet/machinelearning/issues/630) 来预测大量文本中单词/短语的类别。 目前使用 3 Nuget

回答 1 投票 0

为 BERT-NER 标记 100k 数据集

我如何有效地标记数据集直到 100k++?我将其用于 BERT-NER?如果有方法,您能给我类似代码/教程/源代码来实现吗?谢谢!顺便说一句,我将用于我的 B 的数据集...

回答 1 投票 0

如何使用spaCy和Python提取“b-per”、“b-misc”等类型的命名实体识别标签?

我能找到的文档建议在 spaCy 文档中使用 span 的“labels_”属性。然而对我来说,这返回 POS 标签而不是 NER 标签。我需要有类型来指示是否...

回答 1 投票 0

如何下载和导入(最好使用spacy和hugginface)最新训练有素的biobert官方版本来对医学文本执行ner

张等人。 2020年的研究比较了biobert和scispacy ner模型的准确性,总体来说biobert获胜。如何下载和导入(最好使用 spacy 和从 Huggin Face)最新的 **训练过的 **

回答 1 投票 0

spaCy 中的 LLM 模型需要 OpenAI 密钥

#有代码: 导入spacy nlp = spacy.blank("en") #下一行抛出下面的错误 llm_ner = nlp.add_pipe("llm_ner") C:\Program Files\Python311\Lib\site-packages\spacy_...

回答 1 投票 0

从表单中的图像中提取信息

我有一些表格,填写了姓名:某事姓氏:某事等等。所有页面的格式都相似。 我有这种形式的图像。首先我通过 tesseract(pyt...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.