有人遇到过用 Java 实现的 simhash 函数吗?
我已经搜索过,但没有找到任何东西。
顺便说一句。看起来谷歌已经为该算法“申请了专利”。如果您在美国,成功与 Google 竞争,并且没有自己的母公司产品组合,那么不要告诉他们您正在使用它。 C 语言的实现
包含 SimHash Java 实现。还有一个 FastSimHash 实现,使用一点技巧可以将速度提高 10 倍,如这篇博文中所述。
,您应该询问BibSonomy的开发者。