Я поместил текстовый файл с именем Linecount2.txt в hdfs и построил простой rdd для подсчета количества строк, используя spark.
val lines = sc.textFile("user/root/hdpcd/Linecount2.txt")
lines.count()
Это работает.
Но когда я попытался использовать тот же текстовый файл с указанным выше путем, я получаю сообщение об ошибке:
"org.apache.hadoop.mapred.InvalidInputException: Input path does not exist:"
Когда я посмотрел по этому пути, я увидел, что была создана папка 'Linecount.txt'. Поэтому путь к файлу теперь
("user/root/hdpcd/Linecount2.txt/Linecount2.txt")
Затем, после определения пути, я смог его успешно запустить.
В третий раз, когда я попробовал это, я получил ту же ошибку, потому что входной путь не существует.
Когда я прошел путь,
Почему это происходит?