既然会有模运算,为什么我们需要不同的哈希函数呢?
在Grace连接中,两个输入都根据第一个哈希函数进行分区,然后对于每个分区,构建一个哈希表。
如果您对两个操作使用相同的哈希函数,则每个哈希表中的密钥只有相对较少的可能哈希值,因为每个分区仅限于少量的哈希值。这可能导致碰撞增加和效率降低。
根据输入和分区的大小,它并不总是一个问题,但强大的算法不依赖于接收有利的输入。