имена файлов на основе содержимого файла - PullRequest
2 голосов
/ 30 апреля 2010

Итак, некоторый алгоритм для генерации уникального файла разумной длины на основе содержимого двоичного файла. Два файла с одинаковым двоичным содержимым должны иметь одинаковые имена. Очевидно, что это будет иметь ограничения, так как, по-видимому, у вас не может быть уникальных имен файлов разумной длины для каждого из большого набора больших файлов, отличающихся лишь несколькими битами. Но, по-видимому, существует некоторое эвристическое, наилучшее приближение к этому, которое, например, использует известные атрибуты типичных файлов изображений. Если бы у меня было имя какого-то алгоритма, который делает это, я могу найти его в Google и найти другие подходы.

Ответы [ 2 ]

5 голосов
/ 30 апреля 2010

Используйте MD5 хеш содержимого файла.

2 голосов
/ 30 апреля 2010

Я думаю, MD5 стоит проверить. Конечно, это даст вам тот же результат, если содержимое будет таким же, но я думаю, вы можете увеличивать его, пока не получите уникальный.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...