您好,我正在设计一个系统,该系统从API接收文章链接,将文章分类,然后根据用户指定的过滤参数向用户发送推荐文章链接列表。
我计划的最初方法是使用SQL数据库存储排序的文章以及用户信息。然后,每天我都会在商品数据库上运行SQL查询,以供每个用户获取相关的商品链接。我需要弄清的一件事是处理重复的文章/用户,但是即使假设存在唯一的实例,这种方法也似乎效率很低。
我想知道是否有更好的方法来按比例设计系统,即该系统是否必须处理数百万篇文章和数百万用户的范围?
基于相似的文章过滤参数将用户分组在一起会有所帮助(因此,如果两个或多个用户具有相同的文章数据库查询,则可能需要运行较少的查询)?还是这种努力太复杂而不值得吗?
自发地提出这个想法:
常规: