Если oop установка не обязательна.
Spark - это только распределенный вычислительный движок.
Spark предлагает только вычисления и не имеет никакого хранилища. Но Spark интегрирован с огромным разнообразием систем хранения, таких как HDFS, Cassandra, HBase, Mon go DB, локальная файловая система и т. Д. c ....
Spark предназначен для работы в самых разных Платформы управления ресурсами, такие как Spark, Mesos, YARN, Local, Kubernetes и др. c ....
PySpark - это Python API поверх Spark для разработки приложений Spark в Python. Поэтому установка oop не является обязательной.
Примечание. Установка oop требуется только для запуска приложения Pyspark поверх YARN или для доступа к входу / выходу приложения Pyspark из / в HDFS / Hive / HBase или оба.
О размещенном вами предупреждении является нормальным. Так что игнорируй это.