Предполагая, что у вас нет будущего использования хеш-информации (для сравнения с другими текстами или для проверки возможных будущих изменений), есть два случая:
А) документы одинаковые
Б) документы разные
Если A, то между этими двумя сценариями почти нет различий. Оба включают чтение целых файлов по одному фрагменту за раз и выполнение расчета / сравнения для каждого байта. Затраты вычислительных ресурсов хэша минимальны по сравнению с работой по чтению файлов.
Если B, то, возможно, вы найдете разницу на первой странице файлов, и в этот момент вы сможете выйти из процесса.
Таким образом, в зависимости от относительной вероятности A v B, кажется, что сравнение будет в среднем быстрее. Также обратите внимание, что вы могли бы сообщить, где происходит изменение, чего нельзя было сделать в сценарии has.