如何使用文本数据集训练模型

问题描述 投票:0回答:1

我想创建一个生成文本的人工智能模型。具体来说,BDD Gherkin 黄瓜场景和基于用户故事输入的步骤定义。

BDD 小黄瓜示例的用户故事

例如。

用户故事(输入):我想将产品添加到电子商务网站上的购物篮中以进行购买。

输出:自动创建测试用例场景和步骤定义 测试用例场景:

  • 场景 1:验证用户可以将一件商品添加到购物车
  • 场景 2:验证用户可以从购物车中删除一件商品

测试用例场景1:

  • 假设用户使用 和 启动并登录电子商务应用程序
  • 然后用户导航到项目页面。
  • 用户选择并单击 .
  • 用户单击“添加到购物车”按钮。
  • 然后用户应该导航到购物车页面。
  • 用户应在购物车页面中验证已成功添加。

测试用例场景2:

  • 假设用户使用 和 启动并登录电子商务应用程序
  • 然后用户应该导航到购物车页面。
  • 用户在购物车中找到并单击“从购物车中删除”按钮。
  • 然后用户应验证购物中的内容已成功删除。

我创建了一个示例数据集,其中包含映射到场景和步骤定义的用户故事。

数据集

根据我目前的理解,逻辑是:我想根据现有用户故事和场景的数据集来训练模型。模型训练完成后,我想输入一个用户故事,模型应该提出一个带有步骤定义的合适场景。

我是机器学习的新手,只做过某种形式的监督学习、回归。根据一些研究,我需要使用一些 NLP 技术来处理数据集。从那时起,我就很失落了。我看到有些人在谈论使用 ChatGPT 来训练数据集什么的。

做这个项目的好方法是什么。

本质上,我想了解如何使用文本训练模型,以便模型可以接收文本并输出文本。

machine-learning deep-learning large-language-model unsupervised-learning text-generation
1个回答
0
投票

根据我对您问题的阅读,您很可能不需要训练或调整自己的模型。大多数基础模型都应该在这方面做得很好。您所需要做的可能只是编写一个好的提示即可。向llm清楚地描述你的问题并给出一些好的/坏的例子。唯一的问题是,您是否想根据您的输入完全自动化测试用例生成。如果是这种情况,您将需要配置并进行 api 调用,而不是从 UI(例如 ChatGPT)进行操作。

© www.soinside.com 2019 - 2024. All rights reserved.