Как рассчитать контрольную сумму для всех базовых файлов в папке в HDFS? - PullRequest
0 голосов
/ 07 января 2020

У меня есть папка HDFS с несколькими или c файлами внутри. Я хочу вычислить контрольную сумму для всех файлов, присутствующих в папке, вместо повторения для каждого файла.

Для одного файла работает следующее:

hdfs dfs -checksum /STUDENTS/SUBJECTS/MATH/part-00001.snappy.orc

it дает правильный вывод:

/STUDENTS/SUBJECTS/MATH/part-00001.snappy.orc MD5-of-0MD5-of-387AFY22J 0000071110000000000000001874f88271123bfc4fc62e691f1c54ed

Но мне нужно рассчитать MD5 для всех файлов в папке. Я попробовал следующее, посмотрев на ответ на этот вопрос. Но это не решило мою проблему. У меня только ошибки:

$ hdfs dfs -find /STUDENTS/SUBJECTS/MATH/ -type f -exec checksum "{}" \; >> checksum_result.txt

Там написано find: Unexpected argument: -type

Что я делаю не так? Может кто-нибудь помочь мне с этим? Заранее спасибо.

...