Двоичное изображение хэширования - сколько байтового массива использовать? - PullRequest
0 голосов
/ 09 ноября 2011

Я хотел бы хэшировать изображения, которые были преобразованы в байтовые массивы.Чем быстрее процесс, тем лучше, поэтому мне было интересно, сколько из байтового массива из 300000 элементов мне действительно нужно передать в хеш-функцию (в данном случае sha1), чтобы получить уникальную хеш-строку?Кто-нибудь знает, все ли мета-данные в бинарных файлах изображения представляют собой метаданные?Есть ли магический индекс, который я могу использовать вместо полной длины байтового массива?Ex.только первый хэш [5000].

1 Ответ

0 голосов
/ 09 ноября 2011

Мое мнение таково, что это вопрос вероятности наличия уникального хеша для каждого изображения. Если вы используете только первые 5000 байтов изображения размером 300000 байтов, то два изображения, отличающиеся только своей нижней частью, вероятно, будут иметь одинаковый хэш. Это не обязательно вопрос sha1.

Вы также можете распределить свои 5000 байтов равномерно по 300000 байтов.

...