Я пытаюсь запустить интерпретатор %spark.pyspark
в учебном руководстве по Zeppelin по умолчанию, но получаю сообщение об ошибке ниже.Что я делаю не так?
# In the Zeppelin 0.8.1 Tutorial this is %pyspark as written
%spark.pyspark
import os
java.lang.RuntimeException: No pyspark.zip found under /opt/spark/python/lib
at org.apache.zeppelin.spark.PythonUtils.sparkPythonPath(PythonUtils.java:51)
at org.apache.zeppelin.spark.PySparkInterpreter.setupPySparkEnv(PySparkInterpreter.java:218)
at org.apache.zeppelin.spark.PySparkInterpreter.createGatewayServerAndStartScript(PySparkInterpreter.java:291)
at org.apache.zeppelin.spark.PySparkInterpreter.open(PySparkInterpreter.java:194)
at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:69)
at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:616)
at org.apache.zeppelin.scheduler.Job.run(Job.java:188)
at org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:140)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)
at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Это немного похоже на интерпретатор pyspark, которого нет в apache zeppelin , ответы которого у меня не сработали.
Также,Я работаю в Куберне через https://github.com/SnappyDataInc/spark-on-k8s/tree/chart_upgrade_2.4/charts/zeppelin-with-spark: \