Как выполнить проверку контрольной суммы в hadoop после помещения файла в HDFS из локальной файловой системы? - PullRequest
0 голосов
/ 12 сентября 2018

Я перенес файл из локальной файловой системы в HDFS с помощью команды put. Теперь я хочу проверить, поврежден ли мой файл или нет. Я использовал команду контрольной суммы, чтобы проверить значения контрольной суммы обоих файлов.

После выполнения команды контрольной суммы для файла в HDFS я обнаружил, что они используют MD5SUM для вычисления контрольной суммы. Я также вычислил контрольную сумму файла в локальной файловой системе с помощью команды MD5SUM и обнаружил, что обе контрольные суммы различны.

Как показано на рисунке, похоже, что что-то связано с алгоритмом, который HDFS использует для вычисления контрольной суммы. Но я хочу знать, как мы можем проверить, что переданный файл из локальной файловой системы такой же, как и в локальной файловой системе.

Image of calculated checksum

...