Нахождение дублированных имен файлов в папке и перемещение их в другую папку - PullRequest
0 голосов
/ 20 октября 2018

У меня есть папка, содержащая 1000 файлов jpg с несколькими повторяющимися файлами, и повторяющиеся файлы с тем же именем + (2), как указано ниже:

21_201739 (2).jpg
21_201739.jpg 
21_201781.jpg
and so on...

Мне нужно найти все повторяющиеся имена файлов, вырезать и переместитьих в другую папку.Например, мне нужно вырезать

21_201739.jpg & 21_201739 (2).jpg

и переместить их в другую папку

, насколько я знаю, я использовал следующий скрипт

import glob
import hashlib
import os

uniq = set()
for fname in glob.glob('*.jpg'):
with open(fname,"rb") as f:
    sig = hashlib.sha256(f.read()).digest() 
    if sig not in uniq:
        uniq.add(sig)
        print(fname)
    else:
        print(fname, " (duplicate)")

, ноРезультат был разочаровывающим:

21_201739 (2).jpg
21_201739.jpg  (duplicate)
21_201781.jpg  (duplicate)

Я думаю, что сделал что-то не так или что-то упустил.Пожалуйста, вы можете мне помочь?

...