Как упоминали Энак и Доминик, сортировка текстовых файлов строка за строкой и последующее сравнение этих двух файлов с полной уверенностью покажет, отсутствует ли что-либо или нет.
Вы можете вычислить некоторые совокупные значения обоих файлов и сравнить их для достаточного доказательства, что будет намного быстрее.Количество слов и символов одинаковы?Как насчет количества различных алфавитов?Подсчитайте все 26 алфавитов в обоих файлах (вы также можете сделать то же самое для любого набора символов по вашему выбору), если их номера точно совпадают, существует очень высокая вероятность того, что оба файла содержат одинаковую информацию.Это совпадает с вашим подходом к хешированию, но, очевидно, не так надежно.
Если вам нужно знать наверняка, вам придется как-то сравнивать каждую строку файла A с каждой строкой файла B.Если строки полностью перемешаны, сортировка строк в файлах A и B и последующее сравнение файлов будут наилучшим вариантом.Однако, если есть местность (номер строки x файла A имеет тенденцию оставаться около местоположения x в файле B), вы можете также просто сравнить два файла без сортировки, а вместо этого начать поиск строки x файла A вокруг местоположения xв файле Б.