博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用Python+md5删除本地重复(同一张不重名)的照片
阅读量:4700 次
发布时间:2019-06-09

本文共 1091 字,大约阅读时间需要 3 分钟。

使用md5删除重复文件思路和本帖一样

首先遍历需要去重文件夹下的所有文件

然后生成每个文件md5码的同时 和集合中的md5码比较

如md5码不存在,则进行保存.如存在,则不进行保存

最后保存路径的文件 则是不重复的文件

import hashlibimport osfrom PIL import Imageimport numpy as npfiles_path = "这里输入你要去重的文件夹路径.."save_files_path = "这里输入你去重后保存文件的路径..."files = os.listdir(files_path)  # 遍历文件夹下的所有文件temp = set()  # 创建一个set()count = 0  # 删除的文件计数for file in files:    file_path = files_path + file  # 获得完整的路径    img = Image.open(file_path)  # 打开图片    img_array = np.array(img)  # 转为数组    md5 = hashlib.md5()  # 创建一个hash对象    md5.update(img_array)  # 获得当前文件的md5码    if md5.hexdigest() not in temp:  # 如果当前的md5码不在集合中        temp.add(md5.hexdigest())  # 则添加当前md5码到集合中        img.save(save_files_path + file)  # 并保存当前图片到保存文件的路径    else:        count += 1  # 否则删除图片数加一print("duplicate removal:", count)  # 最后输出删除图片的总数
print_r('点个赞吧');var_dump('点个赞吧');NSLog(@"点个赞吧!")System.out.println("点个赞吧!");console.log("点个赞吧!");print("点个赞吧!");printf("点个赞吧!\n");cout << "点个赞吧!" << endl;Console.WriteLine("点个赞吧!");fmt.Println("点个赞吧!")Response.Write("点个赞吧");alert(’点个赞吧’)

转载于:https://www.cnblogs.com/Mrzhang3389/p/11093569.html

你可能感兴趣的文章
Django之Models操作
查看>>
Android学习笔记之初步学百度地图
查看>>
php中引用&的真正理解
查看>>
为什么软件开发,人多、事少、还会工作量大?
查看>>
[Selenium+Java] How to use IntelliJ IDEA & Selenium Webdriver
查看>>
Oracle创建表
查看>>
RobHess的SIFT代码解析步骤二
查看>>
windows server环境下安装unity3d注意事项
查看>>
C#类、接口、虚方法和抽象方法
查看>>
SpringBoot使用@Value从yml文件取值为空--注入静态变量
查看>>
Windows下Memcached的安装配置方法
查看>>
平台设备驱动之平台驱动
查看>>
C++关键字作用总结
查看>>
Codeforces Round #330 (Div. 2)B. Pasha and Phone 容斥
查看>>
HDU 1536 S-Nim SG博弈
查看>>
laravel学习之路5缓存
查看>>
51Nod 1085 背包问题
查看>>
WindowsPhone App如何扩展能够使用的内存
查看>>
串口调适
查看>>
Outlook 2010开机自启动
查看>>