命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等
使用 bert-base-ner 提取公司名称:了解哪些词与哪些词相关的简单方法?
嗨,我正在尝试使用 bert-base-ner 从有关公司的字符串描述中提取完整的公司名称。我也愿意尝试其他方法,但我真的找不到。问题是
TokenClassificationChunkPipeline 抛出错误:“BatchEncoding”对象不是迭代器
遵循这个 HuggingFace 匿名化教程。 使用 pytorch 2.0.0 和 transformers-4.28.1 按原样运行代码,自定义管道出现错误: def 匿名化(文本): 条目=管道(
如本问题(Scispacy for biomedical named entitiy recognition(NER))中所述,模型的“ner”组件将它们标记为“ENTITY”。怎么才能具体识别
ner 的 Roberta transformer 给出索引超出范围错误
我下面有一个函数可以标记和对齐我的标签,但它给我一个错误: def tokenize_and_align_labels(示例,label_all_tokens=True): tokenized_inputs = tokenizer(示例...
无法调用 Language Studio 自定义命名实体识别端点
我已经在 Language Studio 中训练并部署了自定义命名实体识别模型。该模型已成功部署,我可以从 Language Studio UI 对其进行测试,我可以看到检测到的实体...
我正在使用 snips_nlu。我找不到以更通用的方式使用片段的方法。 是否可以根据“位置意义”而不是可能的值来提取值? 示例(完全...
我正在按照 https://huggingface.co/docs/transformers/pipeline_tutorial 上的教程使用 transformers 管道进行推理。例如,以下代码片段适用于获取 NER
我想知道什么是最适合我的任务的神经网络。 我有包含 2000 个文本、标签(实体)的数据,并且每个文本都有提取的第一个和最后一个字符的部分(只有 1
正如您在下面看到的是我的代码,在模型训练后我加载保存的模型但是如果我将测试数据提供给保存的模型,模型不会预测任何实体,我在输出中得到空白实体列表请他...
我有一个包含地名列表的文件,我想将其与研究摘要语料库中的研究地点进行匹配。地名列表存储在如下文件中 地名 特征 长...
尝试将地名词典中的地名/位置与语料库文件中的相应名称相匹配,但没有成功。有什么建议吗?
我有2个文件。一种是具有 4 列的地名词典文件,其中一列包含地名。另一列包含由地名表示的地形特征,而 ...
如何使用 doccano-transformer 发电机输出?
Doccano 是用于机器学习的数据注释工具。 它的创建者还开发了 doccano-transformer,用于转换 doccano gi 的 JSONL 输出格式...
所以我正在 datacamp 上学习 NLP 课程。在控制台上运行以下代码时,它为我提供了正确的输出,但在我的本地计算机上运行时却没有 我试过跑步 创建默认字典:
我正在尝试通过在二进制文本分类(做运动,不做运动)的文本响应中查找运动术语来标记来创建自定义 NER。这是正确的做法吗...
我需要从文本中提取关键词。我有一个关键字字典,比方说 阿帕奇火花 爪哇 路径 亚马逊网络服务 阿帕奇卡夫卡 我有一个工作岗位,例如: 设计、开发和制造……
导入警告 warnings.simplefilter(action='ignore', category=FutureWarning) 将熊猫导入为 pd 将 numpy 导入为 np 导入编解码器 #f = codecs.open(dir+location, 'r', encoding='utf-8') #data = f....
我想从德语的非结构化书面文本中提取日期和其他时间表达式,包括格式如下 'Es ist der 1. Januar 2020.' “Gestern hat es geschneit。” '嘿...
所以我正在尝试创建一个自定义 NER 模型,并按照以下步骤操作: 我得到了带有文本示例和标签以及开始和结束索引的培训日期。 现在我运行以下...
我正在使用 Spacy 并尝试检测文本中的名称。例如,text = 'Keras 是一个很好的包。亚当斯密使用黑色汽车。我希望卡特里娜飓风在她的工作中表现出色。 答案是...
我正在使用 GPT-J,无需微调即可从文本中执行实体提取。我已将我的实验限制在有限数量的实体(人、组织、地点、日期)以保持简单。 我尝试了各种