我有一个N
2-d向量列表,想找出最常出现的k
(= e.g.3)个向量。
差(例如距离,或最好的“相似性度量”?)小于阈值th
的向量应被视为相同。
因此,我想要的输出将是k
个向量的字典,其频率分别为f
。
什么是最有效的算法来计算(伪代码或python会很好)。
计算每个向量的相似性度量(即距离d=sqrt(x^2+y^2)
),然后对向量列表进行排序。相似性度量列表。对列表进行排序Sorting list based on values from another list?