有没有一种方法可以提取法语中的引语及其相关发言人?

问题描述 投票:0回答:1

有没有一种方法可以通过共指的方式提取引用及其相关的说话人?

我想在输出中得到一个带有 [{"speaker" : , "quotes": }] 的字典,如果我们找不到说话者,我们将 None 放入扬声器并添加“潜在说话者”:共同引用

nlp stanford-nlp spacy-3
1个回答
1
投票

如果您想识别引言和说这句话的人,您可以使用经过数据库训练的模型,该数据库包含引言及其各自的说话者。 Citron - https://github.com/bbc/citron 就是这样一种工具,您可以使用它来标记引号。因为模型已经过训练,所以您和其他用户都可以使用。

我不确定您的文档属于哪个领域 - 医疗、IT 还是其他领域?因此,我的建议是微调 Citron 等库提供的预训练模型,使它们更适合您的领域。

© www.soinside.com 2019 - 2024. All rights reserved.