Методы попиксельного хеширования изображений - PullRequest
1 голос
/ 17 июня 2020

Я пытаюсь удалить поврежденные дубликаты jpeg каких-то 27к фотографий. К сожалению, большинство из них на самом деле являются поврежденными дубликатами, показывающими половину или меньше исходного изображения, прежде чем вырезать его до беспорядка / серого. полного изображения (как в aHa sh, pHa sh и dHa sh) попиксельно (начиная с верхнего левого угла и считывая LTR)?

Дело в том, что большинство алгоритмов просто уменьшают размер изображения, а затем создайте ha sh, чтобы сравнить изображения. Поскольку в этих поврежденных файлах действительно отсутствует большая часть данных, невозможно сравнить первые «несколько строк или несколько пикселей изображения». Единственное программное обеспечение, которое приближается к этому, - AllDup, но оно выполняет только побитовое сравнение и не проверяет фактические данные изображения.

Возможно ли это вообще?

Заранее спасибо .

...