我正在开发一个实时流媒体网络应用程序。我们目前有 0 个用户和流数据。
如果我只是随机生成自己的数据,则存在创建不良数据的风险,那么我应该如何训练 ML 模型呢?我应该使用服务(AWZ、Azure 等)吗?
假设您尝试创建具有隐式评级的数据集,则生成随机数据并不是一个有效的解决方案,因为行为数据依赖于用户偏好。
根据您的模型类型,您可以在线查找公共数据集。
这里是一些可能有用的在线数据集的链接。
祝你好运!