Duplicate Cleaner——windows下最专业的重复文件查找器

今天要给大家分享的是windows下一个非常专业的重复文件查找、清理类的软件。为方便英文不好的童鞋,我已义务做了一份简体中文语言文件并提交到了官方,官方表示在下一个版本更新中,会将我这个简体中文语言文件同时加入收费版和免费版中。
做翻译的事情其实很无聊的,并且,你还要对这个软件的每个菜单 ,每一个选项都要熟悉。确保不会因为你的翻译而误导别人。
我个人其实倾向于使用英文原版的软件的。这里的翻译是我自愿的。我只是觉得这个软件用起来很舒服,做得很专业,是个不可多得的好软件。因此,这里也发文章与大家分享一下。最后,翻译如有不当之处,请大家多多指教。

Duplicate Cleaner 官方网站:
http://www.digitalvolcano.co.uk/duplicatecleaner.html

简体中文语言文件下载:
http://www.digitalvolcano.co.uk/board/viewtopic.php?f=12&t=1173

windows下专业的重复文件查找器很多,目前我觉得做得比较好的有下面几个:
Duplicate Cleaner
easy duplicate finder
Duplicate File Detective

其它两个我也都试用过一下。但是总觉得没有Duplicate Cleaner用起来顺手。
其中Duplicate File Detective 4 ,我在一次测试时,给定一个有重复文件的目录给它扫描,居然显示什么也没扫到。无奈只好卸载之。
Duplicate File Detective 4我比较看好它的功能是文件hash缓存功能,缓存的好处是如果在短时间内你需要重复扫描这些文件,可以不必要重复计算hash.
一些文件管理器,如Total Command 、Direcotry Opus等,也具有重复文件查找功能。还有一些软件,如TuneUp 、Revo Uninstaller Pro、Auslogics BoostSpeed和Glary Utilities等,也都附带重复文件查找功能。不过,这里讨论的是“专业”的重复文件查找器。
如果你只需要简单地重复文件查找功能,那么以上程序自带的功能估计也就够你用了。

价格比较

pro版价格:
Duplicate Cleaner $29.95 【有免费版提供】
easy duplicate finder $39.95
Duplicate File Detective v4 Single-User License $28.00

这里只有Duplicate Cleaner是提供免费版本的。免费版本的功能也非常强大。收费版与免费版的区别是,免费版的可以按照特定条件搜索一些特定格式的文件,如音频、图片等。

中文支持情况

目前只有easy duplicate finder官方版本中有中文语言。不过Duplicate Cleaner的下一个版本马上就会有了。前面我抽时间给Duplicate Cleaner做了一个中文语言文件,以方便英文不好的童鞋。
具体可以去官方论坛看:http://www.digitalvolcano.co.uk/board/viewtopic.php?f=12&t=1173
同时,我向作者反馈了下,问他有没有向中国地区的用户推出优惠价格的想法,作者表示会考虑这个。
以下为作者给我的回复:
================================================================
by DigitalVolcano » Fri May 24, 2013 10:35 am

Thank you for this! This looks very good. I shall add it to the next update of Duplicate Cleaner (both versions).

We will also look into adjusting the pricing for China - I know other companies do this with larger software products (eg AutoCAD).

=================================================================

常规文件查找算法比较

easy duplicate finder
CRC32 checksum + FileSize
Byte-by-Byte Comparison
Filename

Duplicate Cleaner:

Match by Content (Byte-by-Byte, MD5 Hash, SHA-1 Hash, SHA-256 Hash methods)
SHA-256
SHA-1
MD5
Byte-to-Byte
Filename (same / similar )
Match by similar content (%)
Match by File Name
Match by File Date Created
Match by File Date Modifed
Match by File Size

Duplicate File Detective :
CRC32 (32bits)
ADLER32 (32bits)
SHA1 (160bits)
SHA256 (256bits)
SHA512 (512bits)

可以看到,除了Duplicate File Detective ,另外两个软件都提供Byte-to-Byte 查找重复文件的方式,这是最慢的算法,但是应该是最靠谱的算法。因此,在这一点上,Duplicate File Detective 似乎对它的hash算法比较自信。不过目前没有任何证据表明,这几个hash算法计算出的东西,只要它们的hash相同,那么内容一定完全相同。因此,如果你要100%保险,那么还是选择Byte-to-Byte 方式吧。

易用性

在界面上,Duplicate Cleaner 和easy duplicate finder 都比较类似。不过Duplicate Cleaner 采用标签式设计,使用起来更加方便。
首先要确定的是搜索规则,即你需要找哪些文件,怎么认定它们是重复的。
从下图,可以看到在常规模式中,可以有很多查找规则,比如,你可以指定相同内容的文件是你要查找的。或者,你只需要查找相同或者相似文件名的文件。甚至可以指定创建或修改日期。或者,你可以指定文件的相似度来扫描。
在文件过滤器中,你可以包含或者排除一些文件,可以限制你要搜索的文件的大小。

对于专业版的,你还可以使用图片模式和音频模式来扫描你的重复文件:
如程序可以按相似度来搜索图片,或者查找旋转过或翻转过的图片(这里旋转过的意思是,如果有一张图片,你用图片处理软件将它旋转了一下,如顺时针旋转了90度,那么,程序依然可以帮你找到这类重复文件)。

然后是音频模式了,这里可以根据音频标签(如IDv3标签等)来查找重复文件:

在选项中,你可以设置“相同内容”的文件依据什么方式来进行比较,如果你倾向于比较保守一点的方式,那么可以选择Byte-to-Byte 方式的比较。其次,你还可以选择md5、sha1、sha256 和 sha512 等散列算法来比较文件。Byte-to-Byte 方式是每个文件按一字节一字节地比较。而散列算法的方式是先计算文件的散列,然后把散列相同的文件认定为是重复的。对于图片文件,你还可以开启图片指标缓存。这里的图片指标(image metrics )是image science 领域的一个专业术语。Duplicate Cleaner甚至支持扫描zip文件中的重复文件(处理方式是:把zip文件当作一个目录来处理),在选项中,你可以设定用于Zip文件的临时空间最大是多少:

好了,规则设定好了,然后就是选择扫描的目录了:

这里解释下那个“扫描自身”。什么叫扫描自身呢?就是对于给定的一个需要扫描的目录,需要扫描这个文件下的文件。
而相反的,“不扫描自身”,则表示,认定这个目录下面的文件没有重复的。也就是说,我只需要扫描这个目录下面的文件,在别的目录中有没有对应的重复文件存在。

好了,规则和目录都设置好了,现在可以点击 “开始扫描”了。
扫描完了之后,在“重复文件”标签页,你可以看到所有“重复组”。因为重复的文件,肯定是两个以上的。因此,这里命名为“组”。
同一个组中的文件,都被认为是“重复”的。

这里要说下,重复文件要找到其实并不难。有很多软件都有这个功能。这里,Duplicate Cleaner的文件选择助手就大显身手了。
文件选取助手主要是用于标记(mark)需要删除或移动的文件。

对于所有重复组,你可以统一选择标记文件大小较小的文件为删除,也可以按日期、文件路径长度等来选择。
你还可以按文件位置(路径)或按文本模式来选择。

按文件位置(路径):

按文本模式选择:

按文本模式选择是比较灵活的一个方式。列名那里,你可以选择文件名、路径、组ID、创建日期、修改日期 。对于音频或图片,还有特定的
列可以选择。
对于音频文件,你甚至可以选择:保留比特率最高的、保留采样率最高的 或保留时长最长的。如下图:我选择的是保留比特率最高的:

说了这么多,可能你已经大概了解到了Duplicate Cleaner的文件选取助手的强大功能了。不过,要体会到它的强大功能,你最好自己实践一下。

好了,对于标记的文件要怎么处理呢?现在你可以点顶部那个大的”删除“按钮了,然后会弹出如下对话框:

可以选择的操作方式有很多,如删除、移动、复制、重命名、创建硬链接等。

如果你现在不想处理,可以直接点击关闭。然后在顶部选择保存profile (配置). 下次打开软件,你可以选择载入配置,再进行处理。

最后,敬告各位,请执行任何对文件的删除操作时确认那是你所需要操作,本人不对因为阅读了本文而使用本软件而造成的任何数据丢失负责。但我在这里可以保证的是,我这里介绍的一些东西,是根据我的一些使用经验来记录的,并且,我很乐意在这里与大家一起分享。
我愿意结交一些软件爱好者(伸手党除外),一起分享一些优秀的软件。

windows平台下的其它一些重复文件查找工具:
http://www.duplicatefileremover.com/
http://www.bigbangenterprises.de/en/doublekillerpro/comp.htm (好久没有更新了)

开源:
http://sourceforge.net/projects/yadfr/
http://sourceforge.net/projects/doubles/

免费:
Duplicate Cleaner Free
http://www.bigbangenterprises.de/en/doublekiller/
http://www.nirsoft.net/articles/find_duplicate_files.html

--EOF--

更多
6 Responses Post a comment
  1. 荒野无灯

    @善用佳软我原以为官方会在下一个fix版本中才加入的。文章中忘记总结了,其实这个软件,个人认为主要突出在:
    1.标签式界面,所有操作一览无余,只须从左往右依次操作,使用简单.
    2.文件查找和过滤规则全面、到位.
    3.文件选择助手非常灵活、方便。数据无价,因此,文件的删除,不能因为文件是重复的就直接“删除重复”的。它的标记功能,可以很好的帮助用户完成删除工作。除了一系列便捷的文件选取菜单外,程序还会自动保存profile(有点类似于会话),如果一次没有处理完,可以下次打开程序接着处理。

  2. 善用佳软

    刚刚下载 Duplicate Cleaner Free v3.1.5,发现已经有你的简体中文语言了。

  3. Louis Han

    以前还做过几个软件的中文翻译 现在都懒得去干这些了

  4. 荒野无灯

    @蓝冰呃,重复了,东西不好找。。。再说,这个软件是需要人肉判断哪些文件要被删除的。选择在你手上。

  5. 蓝冰

    就让他重复吧。。反正硬盘用不完。。实在用完了就换个大的,我就因为清理文件丢掉过好多次重要信息。。。

Leave a Reply

Note: You may use basic HTML in your comments. Your email address will not be published.

Subscribe to this comment feed via RSS