删除(附近)重复文件

问题描述 投票:0回答:3

在 Windows(本例中为 XP)中根据文件规范删除(接近)重复文件的最佳脚本方式是什么?我正在考虑 RegEX 和一些 VB 脚本,但如果有更好的方法......

示例包括名称略有不同的文件名,末尾或开头有一个或两个(已知)额外字符但大小相同,大小也略有不同的文件..等

如果边界已知,正则表达式是处理这些差异的最佳方法吗?

regex file vbscript
3个回答
2
投票

不,我认为正则表达式不是正确的工具。如果你问我的话,这听起来有点危险。 无论如何,您可以计算两个文件名之间的编辑距离,如果足够小(请小心仅包含几个字符的文件名!),请删除两个文件之一。

可以使用简单的算术来计算尺寸。


0
投票

您可以使用正则表达式来匹配(或接近匹配)文件名。

我会使用正则表达式来匹配名称,并构建文件大小列表。 您可以根据落在该差异范围内的文件大小来计算差异。

建立匹配文件列表后,您可以访问不同的文件属性(大小、日期等)来标记要删除的文件。


0
投票

您可以使用DuplicateFilesDeleter软件删除重复文件。这是删除重复文件的最佳方法。

© www.soinside.com 2019 - 2024. All rights reserved.