У меня есть скрипт spark, который читает содержимое файла spark.read.textFile(filePath)
Я запускаю его из контейнера самого мастера и пытаюсь передать этот файл с параметром --files
, таким как
./spark-submit --class nameOfClass --files local/path/to/file.csv --master spark://master_ip generated_executable.jar local/path/to/file.csv`
Но тогда я получаю ошибку
java.io.FileNotFoundException: File file:/local/path/to/file.csv does not exist
Я попытался изменить строку на: spark.read.textFile(SparkFiles.get(fileName))
, но ошибка не исчезла, теперь она говорит
java.io.FileNotFoundException: File file:/mnt/mesos/sandbox/spark-946bbaef-a258-4951-9b15-bec77b78bf5d/userFiles-3f9dcf85-4114-4968-b625-6bb1498f568d/file.csv does not exist
Если Я вручную добавляю файл каждому работнику, он работает. Но я не хочу этого делать. Есть ли способ передать файл из контекста, в котором он отправляет задание?