Блокнот Zeppelin без модуля с названием pandas и matplotlib - PullRequest
0 голосов
/ 04 июня 2018

Привет, ребята,

Мой вопрос о ноутбуке Zeppelin.Я новичок в среде Zeppelin.У меня есть аккаунт AWS.Я работаю над кластером EMR.Я хочу использовать панд и матплотлиб в среде дирижабля.Но я получил ошибку: нет модуля с именем pandas и matplotlib.Я нахожу этот учебник.Я подошел к шагу 8, но у меня все еще не возникает та же проблема.У Цеппелина есть переводчик.Я пытаюсь изменить путь Python, даже если я уверен, что путь, я все еще получил ту же ошибку. В этой ссылке упоминается Если кто-то сталкивался с этими проблемами, пожалуйста, помогите мне.

%pyspark
import os
import numpy
import pandas
import matplotlib

print("Numpy "+numpy.__version__)
print("Pandas "+pandas.__version__)
print("Matplotlib "+matplotlib.__version__)

Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 367, in <module>
raise Exception(traceback.format_exc())
Exception: Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 355, in <module>
exec(code, _zcUserQueryNameSpace)
File "<stdin>", line 3, in <module>  
ImportError: No module named pandas

1 Ответ

0 голосов
/ 13 июня 2018

Я понял, что тяну путь с моей машины EC2.Я ввожу свой SSH в мастер-узел на AWS.Я устанавливаю панды и матплотиб.Затем выполните команду «Какие Python» на этом экземпляре.После этого я скопировал в путь pyspark.python.Наконец-то это сработало.

...