У меня есть папка, содержащая 1000 файлов jpg с несколькими повторяющимися файлами, и повторяющиеся файлы с тем же именем + (2), как указано ниже:
21_201739 (2).jpg
21_201739.jpg
21_201781.jpg
and so on...
Мне нужно найти все повторяющиеся имена файлов, вырезать и переместитьих в другую папку.Например, мне нужно вырезать
21_201739.jpg & 21_201739 (2).jpg
и переместить их в другую папку
, насколько я знаю, я использовал следующий скрипт
import glob
import hashlib
import os
uniq = set()
for fname in glob.glob('*.jpg'):
with open(fname,"rb") as f:
sig = hashlib.sha256(f.read()).digest()
if sig not in uniq:
uniq.add(sig)
print(fname)
else:
print(fname, " (duplicate)")
, ноРезультат был разочаровывающим:
21_201739 (2).jpg
21_201739.jpg (duplicate)
21_201781.jpg (duplicate)
Я думаю, что сделал что-то не так или что-то упустил.Пожалуйста, вы можете мне помочь?