не удается найти python3.7 при запуске spark с использованием spark-submit? - PullRequest
0 голосов
/ 27 августа 2018

Есть проблема, которая беспокоила меня в течение нескольких дней.Это происходит, когда я запускаю приложение Spark, используя spark-submit, это выглядит примерно так:

09:14:36 Exception in thread "main" java.io.IOException: Cannot run program "python3.7": error=2, No such file or directory
09:14:36    at java.lang.ProcessBuilder.start(ProcessBuilder.java:1048)
09:14:36    at org.apache.spark.deploy.PythonRunner$.main(PythonRunner.scala:100)
09:14:36    at org.apache.spark.deploy.PythonRunner.main(PythonRunner.scala)
09:14:36    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
09:14:36    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
09:14:36    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
09:14:36    at java.lang.reflect.Method.invoke(Method.java:498)
09:14:36    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
09:14:36    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:894)
09:14:36    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
09:14:36    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
09:14:36    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
09:14:36    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
09:14:36 Caused by: java.io.IOException: error=2, No such file or directory
09:14:36    at java.lang.UNIXProcess.forkAndExec(Native Method)
09:14:36    at java.lang.UNIXProcess.<init>(UNIXProcess.java:247)
09:14:36    at java.lang.ProcessImpl.start(ProcessImpl.java:134)
09:14:36    at java.lang.ProcessBuilder.start(ProcessBuilder.java:1029)
09:14:36    ... 12 more

Я настроил все переменные среды как в ~/.bashrc, так и /etc/profile.И я абсолютно уверен, что все переменные среды верны.И я могу запустить python3.7 или PySpark в моем Ubuntu.

export JAVA_HOME=/usr/lib/jvm/java-8-oracle
export PATH=${PATH}:${JAVA_HOME}
export PATH=${PATH}:/mwdata/python3.7/bin
export SPARK_HOME=/srv/spark
export PATH=${PATH}:${SPARK_HOME}/bin
export PYSPARK_PYTHON=python3.7
export PYSPARK_DRIVER_PYTHON=python3.7

Так почему он не находит python3.7?

1 Ответ

0 голосов
/ 02 октября 2018

По своей сути PySpark зависит от Py4J (в настоящее время версия 0.10.7)

К сожалению, текущая версия py4j 0.10.7 не совместима с Python 3.7.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...