возможно, вы думаете о хеш-списках или хеш-деревьях , которые можно использовать для уменьшения скорости передачи данных (например, в бит-торренте)?к сожалению, они отличаются от того, что вы помните, несколькими способами:
- они все еще хэшируют весь файл (но по частям)
- они используются, чтобы не снижать стоимость сети при построениихеш, но для обнаружения изменений в зонах с ограниченным доступом, чтобы было необходимо передавать меньше данных (например, в bittorrent, чтобы определить, какая часть файла должна быть загружена)
, как Сильвен Прат говорит вышехэширование только нескольких частей файла ненадежно, поскольку оно будет определять изменения только этих частей, а не всего файла.
в вашем случае вы можете рассчитать хеш-листы локально для каждого набора данных (т.е. запустить расчет хеша на локальной машине).затем, сравнивая, какие хеши совпадают, а какие нет, переносятся только по разным частям (если это то, что вам нужно сделать).