如何训练用于特定信息提取的模型

问题描述投票：0回答：1

我有一个判决句子文本的数据集，如下所示 “被告人因持械抢劫罪被判有期徒刑10年，并处罚金5美元及规费。考虑到被告人配合调查且无前科，减刑自本裁决最终生效之日起最高可判处 5 年监禁。”

我如何训练/调整模型/（哪些模型最好）并预处理数据以理解文本，并只给我减刑“从本裁决最终生效之日起入狱 5 年”。作为输出

deep-learning nlp

1个回答

1
投票

这看起来像是一个被框架为摘要生成任务的问题。

为了让事情变得简单并为您提供一个起点，这里有一些需要考虑的基本方面

您可以有两种类型的摘要：抽象和提取。
您的情况是前者，因为您确实想要一个
捕获的输入文本的摘要/固有逻辑，而不是仅提取一些
具体的话。如果您只想要后者，您也可以将您的问题构建为 NER（命名实体识别问题），而不仅仅是提取摘要问题。
您需要生成训练对，例如
```
[full_text,    summary]
```
才能训练您的模型。
对于这样的数据集（抽象概括）你可以尝试搜索在线，这是此类数据集的示例：
https://paperswithcode.com/dataset/billsum。
一旦您看到数据集的样子，您就可以尝试创建一个
您自己的类似数据集，然后微调法学硕士以满足
你的用例。这是关于 HuggingFace 的教程，介绍如何对上面指定的确切数据集进行抽象摘要的微调：https://huggingface.co/docs/transformers/tasks/summarization

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.