Как установить переменную PATH для рабочих свечей? - PullRequest
0 голосов
/ 24 апреля 2020

В моем общем искровом кластере по умолчанию python на рабочих нет необходимых мне пакетов. И я не могу напрямую редактировать конфиг искры. Итак, я скопировал среду в мой кластер, а затем запустил этот код, чтобы добавить каталог пакетов к пути, чтобы он был найден первым.

def fix_paths():
  sys.path.insert(0, '/path/to/lib/python3.6/site-packages')

dataframe = spark_session.read.parquet("file_path")
dataframe.foreachPartition(fix_paths)

Этот код занимает много времени, и я думаю, что проблемы, если датафрейм перечитывается с диска. Есть ли другой способ убедиться, что эти пакеты читаются первыми, когда появляется новый работник?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...