在 Windows(本例中为 XP)中根据文件规范删除(接近)重复文件的最佳脚本方式是什么?我正在考虑 RegEX 和一些 VB 脚本,但如果有更好的方法......
示例包括名称略有不同的文件名,末尾或开头有一个或两个(已知)额外字符但大小相同,大小也略有不同的文件..等
如果边界已知,正则表达式是处理这些差异的最佳方法吗?
不,我认为正则表达式不是正确的工具。如果你问我的话,这听起来有点危险。 无论如何,您可以计算两个文件名之间的编辑距离,如果足够小(请小心仅包含几个字符的文件名!),请删除两个文件之一。
可以使用简单的算术来计算尺寸。
您可以使用正则表达式来匹配(或接近匹配)文件名。
我会使用正则表达式来匹配名称,并构建文件大小列表。 您可以根据落在该差异范围内的文件大小来计算差异。
建立匹配文件列表后,您可以访问不同的文件属性(大小、日期等)来标记要删除的文件。
您可以使用DuplicateFilesDeleter软件删除重复文件。这是删除重复文件的最佳方法。