У меня есть папка HDFS с несколькими или c файлами внутри. Я хочу вычислить контрольную сумму для всех файлов, присутствующих в папке, вместо повторения для каждого файла.
Для одного файла работает следующее:
hdfs dfs -checksum /STUDENTS/SUBJECTS/MATH/part-00001.snappy.orc
it дает правильный вывод:
/STUDENTS/SUBJECTS/MATH/part-00001.snappy.orc MD5-of-0MD5-of-387AFY22J 0000071110000000000000001874f88271123bfc4fc62e691f1c54ed
Но мне нужно рассчитать MD5 для всех файлов в папке. Я попробовал следующее, посмотрев на ответ на этот вопрос. Но это не решило мою проблему. У меня только ошибки:
$ hdfs dfs -find /STUDENTS/SUBJECTS/MATH/ -type f -exec checksum "{}" \; >> checksum_result.txt
Там написано find: Unexpected argument: -type
Что я делаю не так? Может кто-нибудь помочь мне с этим? Заранее спасибо.