Я использовал платформу graphframes в pyspark, которая некоторое время работала нормально (я использовал модуль graphframes), но через некоторое время я получил ошибку: «Нет модуля с именем graphframes».
Иногда это ошибка, иногда он может завершить запуск, иногда нет.
pyspar-версия: 2.2.1
graphframe: 0,6
ошибка:
19/06/05 02:22:17 ERROR Executor: Exception in task 641.3 in stage 216.0 (TID 123244)
org.apache.spark.api.python.PythonException: Traceback (most recent call last):
File "/appcom/spark-2.2.1/python/lib/pyspark.zip/pyspark/worker.py", line 166, in main
func, profiler, deserializer, serializer = read_command(pickleSer, infile)
File "/appcom/spark-2.2.1/python/lib/pyspark.zip/pyspark/worker.py", line 55, in read_command
command = serializer._read_with_length(file)
File "/appcom/spark-2.2.1/python/lib/pyspark.zip/pyspark/serializers.py", line 169, in _read_with_length
return self.loads(obj)
File "/appcom/spark-2.2.1/python/lib/pyspark.zip/pyspark/serializers.py", line 455, in loads
return pickle.loads(obj, encoding=encoding)
File "/data/data08/nm-local-dir/usercache/hduser0011/appcache/application_1547810698423_82435/container_1547810698423_82435_02_000041/ares_detect.zip/ares_detect/task/communication_detect.py", line 11, in <module>
from graphframes import GraphFrame
ModuleNotFoundError: No module named 'graphframes'
Команда:
spark-submit --master yarn-cluster \
--name ad_com_detect_${app_arr[$i]}_${scenario_arr[$i]}_${txParameter_app_arr[$i]} \
--executor-cores 4 \
--num-executors 8 \
--executor-memory 35g \
--driver-memory 2g \
--conf spark.sql.shuffle.partitions=800 \
--conf spark.default.parallelism=1000 \
--conf spark.yarn.executor.memoryOverhead=2048 \
--conf spark.sql.execution.arrow.enabled=true \
--jars org.scala-lang_scala-reflect-2.10.4.jar,\
org.slf4j_slf4j-api-1.7.7.jar,\
com.typesafe.scala-logging_scala-logging-api_2.10-2.1.2.jar,\
com.typesafe.scala-logging_scala-logging-slf4j_2.10-2.1.2.jar,\
graphframes-0.6.0-spark2.2-s_2.11.jar \
--py-files ***.zip \
***/***/****.py &
Удаляет ли pyspark эти jar-файлы, когда ему не хватает памяти?