Интересно, «безопасно» ли хешировать кучу значений MD5 вместе, чтобы создать новый хэш, или это каким-либо образом увеличит вероятность коллизий?
Фон: у меня есть пара файлов с зависимостями. У каждого файла есть связанное хеш-значение, которое рассчитывается на основе его содержимого. Давайте назовем это хеш-значением для одного файла. В дополнение к этому, файл также должен иметь хеш-значение, которое включает в себя все зависимые файлы, хеш-значение «multi-file».
Таким образом, вопрос заключается в следующем: могу ли я просто взять все хеш-значения MD5 для отдельных файлов зависимых файлов, объединить их, а затем вычислить MD5 по объединенным значениям, чтобы получить хеш-значение для нескольких файлов. Или это приведет к хешу MD5, который может столкнуться с большей вероятностью, чем если бы я конкатенировал содержимое всех зависимых файлов вместе.
В качестве альтернативы, могу ли я скомпоновать однофайловые хеш-значения вместе, чтобы сгенерировать многофайловое хеш-значение, или это может привести к большему количеству коллизий?