Доступ к индексу файла с хэшами для выявления новых дубликатов - PullRequest
0 голосов
/ 18 апреля 2020

Я регулярно запускаю jdupes на своем резервном диске, чтобы найти дубликаты файлов и жестко связать их, чтобы сэкономить место. Но это занимает много времени:

sudo jdupes -rHL /mnt/backup_drv

   -r recursive
   -H treat already hard linked files as duplicates
   -L hard link all duplicate files

Могу ли я реализовать скрипт с механизмом, который сравнивает только новые файлы со списком уже существующих файлов? В моей системе работает как минимум два индексатора: (m) locate (updatedb) и gnome-tracker. Я также думаю, что у rdiff-backup есть какая-то база данных. Содержат ли базы данных этих программ имена и хэши всех существующих файлов? Могу ли я получить к ним доступ и проверить, существует ли новый файл и является ли он идентичным? Или есть еще что-нибудь подобное?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...