哈希相似度

问题描述 投票:7回答:3

通常,哈希的目标是将一个连续函数变成一个离散函数:输入中的小变化应该导致输出中的大变化。但是,是否有任何哈希算法可以(非常)粗略地为相似的输入返回相似但(仍然不同)的哈希值?

hash
3个回答
10
投票
查看Locality Sensitive Hashing(LSH)。例如,这是一种快速找到给定点附近的点的概率方式。

1
投票
给出一个告诉您对象有多相似或不同的距离函数,您还可以采用距离排列:http://www.computer.org/portal/web/csdl/doi/10.1109/TPAMI.2007.70815或草图:http://portal.acm.org/citation.cfm?id=1638180

对于后一种方法的实现:http://obsearch.net


0
投票
您真的不想看到类似的哈希。哈希是为了确保完整性,因此文件/应用程序/程序中的最细微更改都会产生完全不同的哈希。如果两个不同的字符串显示相同的哈希,这称为冲突,并且哈希算法现在受到损害。 MD5有一些冲突,但今天仍在使用。
© www.soinside.com 2019 - 2024. All rights reserved.