假设您有一个数据库
Transcation-ID Item_list
1 [bread, butter, milk, diaper]
2 [bread, butter]
3 [coke, diaper]
4 [Chips, beer, bread]
在这种情况下,找到关联规则后,如何根据关联规则找到相似交易(即集群相似交易)?
但是找到类似的交易将花费更多的空间和时间。
[关于here,有一篇很好的文章。
您可以先采用数据集的所有唯一元素,然后通过遍历所有交易并使用公式计算其置信度来找到其与其他项目的关联,然后将“提升,支持,置信度”等任何一种技术应用于您的项目列表。在文章中)。
但是,如果您的数据集非常大,那么将需要所有时间来运行所有项目。