Сравнение изображений и удаление похожих изображений для каждой строки - PullRequest
0 голосов
/ 26 марта 2020

Мне нужно сравнить 400000 изображений и удалить похожие изображения. У меня будет около 100000 идентификаторов с несколькими изображениями разного размера в одном файле. Я хотел бы создать два столбца ID и изображения и для каждого идентификатора удалить похожие изображения. Если у одного идентификатора есть 10 изображений, но отличаются только два, я хотел бы иметь только два изображения для этого идентификатора. Я ищу такой же простой способ сделать это в python.

1 Ответ

1 голос
/ 27 марта 2020

import PIL
from PIL import Image
import imagehash

hash1 = imagehash.phash(Image.open('image_a.jpg'))
print(hash1)

hash2 = imagehash.phash(Image.open('image_b.jpg'))
print(hash2)


hash1 == hash2


вывод

e5969a1b256e8cc9

ebd49312f02e862f

False

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...