Matplotlib Plotting с использованием ноутбука AWS-EMR jupyter - PullRequest
4 голосов
/ 31 марта 2019

Я пытаюсь нанести данные с помощью Matplotlib в блокнот jupyter на экземпляре AWS-EMR. Matplotlib должен быть установлен с помощью действия начальной загрузки при запуске экземпляра, что я сделал успешно. Я также успешно установил Pandas таким образом (и использовал его для разных вещей в своем ноутбуке). Типичный %matplotlib inline не работает. (На самом деле, похоже, что никакие магические команды не работают на ноутбуках AWS-EMR. Я подозреваю, что AWS отключил их или имеет какое-то отношение к тому, что ноутбуки «без сервера».)

Я пробовал:

  • установка matplotlib == 2.0.2 и использование магической команды %matplotlib inline (как упоминалось выше, магические команды, похоже, не работают вообще)

  • установка matplotlib == 1.5, установка ipympl и использование import ipympl. Я не получаю ошибок при использовании этого метода при попытке .show() заговора, но при этом также не появляется заговор. Ячейка работает в тетради без появления графика. Насколько я могу судить, .show() ничего не делает.

1 Ответ

1 голос
/ 28 мая 2019

Протестировано на этикетке релиза: emr-5.21.0


В ноутбуке EMR нет волшебства %matplotlib в ядре искровой магии.Наберите %%help, чтобы увидеть все поддерживаемые магические эффекты.

pyspark ядро ​​отправляет запросы REST в удаленный кластер EMR через Livy.Так что построение сюжета на искровом кластере не имеет особого смысла.Выполните обработку данных с использованием ядра pyspark распределенным способом, а затем выполните работу с графиком в режиме %%local.

Попробуйте запустить ячейку с %%local, а затем запустите код

%%local 
%matplotlib inline
<some code to plot charts>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...