从现有数据生成推荐系统的测试数据集

问题描述投票：0回答：1

我正在尝试使用 apache-spark 的 scala API 构建一个推荐系统。

我有一个表单（用户、产品、评级）的数据集，其中包含所有用户已评级的所有项目。为了提供建议，我需要一个 (U,P) 形式的数据集，其中包含我的初始数据集中不存在的所有 U,P 对。（用户，每个用户未购买的所有产品的产品对）。有人知道有什么直接的方法可以做到这一点吗？

ps-您可以假设除了初始集中的用户或项目之外没有其他用户或项目。

scala apache-spark recommendation-engine

1个回答

0
投票

本教程可能对您非常有帮助：

http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.