Я работаю над edgenode, где некоторые библиотеки, такие как pandas, sqlalchemy, которые я установил вручную, потому что прокси-сервер слишком ограничен.
Я пытаюсь добавить эти библиотеки в мое задание spark, чтобы развернуть его в кластере, гдебиблиотеки не установлены, я знаю, что для этого нужно добавить некоторые параметры
spark-submit --master yarn-cluster --deploy-mode cluster --queue high --py-files filesToAdd sparkjob.py
Но я не знаю, какой "filesToAdd" мне нужно поместить в командную строкуэто исходный код библиотеки? это определенная часть этого? это что-то еще?