我正在尝试实现数字字符串的可视化表示,以使用户更容易识别相似的值。第一部分是生成数据的固定长度哈希 - 但是我不知道合适的哈希算法。
到目前为止,我所有的谷歌搜索都返回了无数对加密哈希值的引用;输入中的微小变化会产生输出中的大变化 - 与我想要在这里实现的目标完全相反(实际上,数量惊人的评论者认为唯一的哈希类型是加密哈希)。
有可用的哈希算法可以做到这一点吗?
(我知道哈希行为如我所描述的那样会有很高的冲突概率 - 这只是一个小问题)
事实证明,这类哈希通常被称为“近似哈希”——并且已经发布了用于执行此操作的机制。它广泛应用于生物信息学和人工智能领域。有一个特定的子类,局部敏感哈希,它似乎有许多合适的实现。