Как удалить дубликаты PDF-файлов из списка в Python - PullRequest
0 голосов
/ 27 июня 2019

У меня есть список, содержащий файлы pdf

l=['ab.pdf', 'cd.pdf', 'ef.pdf', 'gh.pdf']

Из этих четырех файлов немногие являются дублирующими, меняются только имена, как удалить эти файлы из списка?

например, ab.pdf и cd.pdf одинаковы, поэтому окончательный результат будет

l=['ab.pdf', 'ef.pdf', 'gh.pdf']

Я пробовал библиотеку filecmp, но она сообщает только, если два файла дублируются.

Как это сделать наиболее эффективно - по-питонски?

P.S. Этот вопрос не является дубликатом, пожалуйста, прочитайте весь вопрос, прежде чем пометить его как дубликат.

1 Ответ

0 голосов
/ 27 июня 2019

Затем вам нужно указать компьютеру путь к файлам на вашем компьютере и сравнить файлы один за другим, хотя это звучит не так эффективно.

...