Привет, ребята,
Мой вопрос о ноутбуке Zeppelin.Я новичок в среде Zeppelin.У меня есть аккаунт AWS.Я работаю над кластером EMR.Я хочу использовать панд и матплотлиб в среде дирижабля.Но я получил ошибку: нет модуля с именем pandas и matplotlib.Я нахожу этот учебник.Я подошел к шагу 8, но у меня все еще не возникает та же проблема.У Цеппелина есть переводчик.Я пытаюсь изменить путь Python, даже если я уверен, что путь, я все еще получил ту же ошибку. В этой ссылке упоминается Если кто-то сталкивался с этими проблемами, пожалуйста, помогите мне.
%pyspark
import os
import numpy
import pandas
import matplotlib
print("Numpy "+numpy.__version__)
print("Pandas "+pandas.__version__)
print("Matplotlib "+matplotlib.__version__)
Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 367, in <module>
raise Exception(traceback.format_exc())
Exception: Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 355, in <module>
exec(code, _zcUserQueryNameSpace)
File "<stdin>", line 3, in <module>
ImportError: No module named pandas