Мне нужно сравнить 400000 изображений и удалить похожие изображения. У меня будет около 100000 идентификаторов с несколькими изображениями разного размера в одном файле. Я хотел бы создать два столбца ID и изображения и для каждого идентификатора удалить похожие изображения. Если у одного идентификатора есть 10 изображений, но отличаются только два, я хотел бы иметь только два изображения для этого идентификатора. Я ищу такой же простой способ сделать это в python.