【Python】
查找相同文件代码
作者: / 发布于2016/3/3/ 837
python 查找相同文件代码示例。简单说明下原理吧!
1.先定义了filesizes的字典,其中键是文件大小,值是相同文件大小的文件路径( {"size":[path1,path2.....],"size2":[path1,path2.....]} )
2.Eqlfiles与filesizes差不多只不过键变成了hash值
3.errfile是用来存储读取时发生错误的文件(然并卵),因为本人在扫描时发现由于一些文件名是特殊文字会读取错误
4.遍历自己定义的路径获取所有文件
5.过滤出值长度为1的文件集
6.获取文件的crc或hash值进行逐一比较,将相同值的储存到Eqlfiles
7.最后,就是处理Eqlfiles里的文件了,示例里是输出文件路径的(各位可以自行处理)