Я хочу использовать образ Docker с Apache Spark в Ubuntu 18.04.
Более популярное изображение из хаба имеет Spark 1.6 .
Второе изображение имеет более свежую версию Spark 2.2
Ни на одном образе не установлено numpy Базовые примеры для Spark Основное руководство MLlib требует его.
Я попытался запустить Dockerfile для неудачной установки numpy, добавив его в исходный образ Dockerfile для Spark 2.2:
RUN apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose
Как настроить контейнер на использование простой установки ОС? Какая процедура? Это правильное направление вообще?
Редактировать: ОС Ubuntu 18.04