Я занимаюсь разработкой приложения, в котором я читаю файл из hadoop, обрабатываю и сохраняю данные обратно в hadoop.
Я запутался, какой должен быть правильный формат пути файла hdfs. При чтении файла hdfs из оболочки Shell вроде
val file=sc.textFile("hdfs:///datastore/events.txt")
работает нормально, и я могу прочитать.
Но когда я собираю банку с пряжей, которая содержит тот же набор кодов, это выдает ошибку, говорящую
org.apache.hadoop.HadoopIllegalArgumentException: Uri without authority: hdfs:/datastore/events.txt
Когда я добавляю имя узла ip как hdfs://namenodeserver/datastore/events.txt
, все работает.
Я немного озадачен поведением и нуждаюсь в руководстве.
Примечание: я использую настройку aws emr, и все конфигурации по умолчанию.