Я работаю над проектом MapReduce, и он предполагает использование большого файла. Файл, который содержит информацию 1,5 ГБ, поэтому я не могу загрузить ее в GitHub. Я использовал пример файла для проверки моего картографа и редуктора. Образец файла был загружен в GitHub. Теперь я хотел бы проверить свой код на полном размере файла, чтобы увидеть результаты.
Чтобы использовать образец файла, который я загрузил в GitHub, я указываю на него, используя следующий код
/usr/local/hadoop/bin/hdfs dfs -copyFromLocal ../../parking-violations-data/Parking_Violations.csv /1a/input/
Как я могу указать файл, который хранится на моем компьютере?