У меня есть исходный код, где UDF использует dill
. У меня есть другие пакеты, используемые в моем исходном коде, и все они перечислены в файле require.txt. Поэтому я делаю следующее, но он говорит, что «модуль не найден» для «укропа»
pip install -r requirements.txt --target ./dependencies
cd dependencies
zip dependencies.zip .
cd ..
spark-submit --master yarn --jars example.jar --conf spark.executor.instances=10 --pyfiles dependencies.zip --name example_job example.py arg1 arg2
Это дает следующую ошибку:
No module named "dill"
Я вижу, что нам нужно пройти яйцо файлы явно в аргументе --pyfiles
, но где взять файл яйца для укропа?