Spark: Как изменить выходной каталог локальной SparkSession? - PullRequest
0 голосов
/ 03 мая 2018

У меня есть следующее SparkSession, которое я использую для тестирования:

  SparkSession.builder().master("local").getOrCreate()

Каждый раз, когда я запускаю, например, модульный тест, который записывает данные, например, df.write.csv("foobar"), выходной каталог будет находиться на верхнем уровне моего проекта. Я знаю, что могу изменить аргумент пути к автору записи, но меня особенно интересует глобальное изменение корневого каталога (как для чтения, так и для записи) без необходимости указывать его вне конфигурации.

1 Ответ

0 голосов
/ 09 мая 2018

После долгих отладок я понял это. Все, что требуется, это установить user.dir системное свойство. Например: System.setProperty("user.dir", "/tmp"), и все ваши локальные таблицы и выходные файлы будут сохранены в /tmp.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...