Ошибка при установке Spark на Google Colab - PullRequest
0 голосов
/ 19 марта 2019

Я получаю сообщение об ошибке при установке spark на Google Colab. Это говорит

tar: spark-2.2.1-bin-hadoop2.7.tgz: Не удается открыть: нет такого файла или каталога tar: Ошибка не устраняется: выход сейчас.

Это были мои шаги

введите описание изображения здесь

Ответы [ 2 ]

0 голосов
/ 11 мая 2019

Чтобы запустить spark в Colab, сначала нам нужно установить все зависимости в среде Colab, такие как Apache Spark 2.3.2 с hadoop 2.7, Java 8 и Findspark, чтобы найти искру в системе. Установка инструментов может выполняться внутри ноутбука Jupyter от Colab.

!apt-get install openjdk-8-jdk-headless -qq > /dev/null
!wget -q https://www-us.apache.org/dist/spark/spark-2.4.3/spark-2.4.3-bin-hadoop2.7.tgz
!tar xf spark-2.4.3-bin-hadoop2.7.tgz
!pip install -q findspark

если вы снова получаете эту ошибку: Не удается открыть: нет такого файла или каталога tar

Посетите сайт Apache spark и получите последнюю версию сборки: 1. https://www -us.apache.org / dist / spark / 2. http://apache.osuosl.org/spark/

заменить spark- 2.4.3 жирными словами на последнюю версию.

0 голосов
/ 19 марта 2019

вы используете ссылку для старой версии, будут работать следующие команды (новая версия)

!apt-get install openjdk-8-jdk-headless -qq > /dev/null
!wget -q http://apache.osuosl.org/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz
!tar xf spark-2.4.0-bin-hadoop2.7.tgz
!pip install -q findspark
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...