Существуют различные способы установки пакетов в Azure Блоки данных:
Метод1: Использование библиотек
Для создания сторонних или локально созданный код, доступный для записных книжек и заданий, работающих в ваших кластерах, вы можете установить библиотеку. Библиотеки могут быть записаны в Python, Java, Scala и R. Вы можете загружать библиотеки Java, Scala и Python и указывать на внешние пакеты в репозиториях PyPI, Maven и CRAN.
Действия по установке сторонних библиотек:
Шаг 1: Создание кластера блоков данных.
Шаг 2: Выберите созданный кластер.
Шаг 3: Выберите библиотеки => Установить новый => Выберите источник библиотеки = "Maven" => Координаты => Пакеты поиска => Выберите Maven Central => Поиск для пакета требуется. Пример: (GDAL) => Выберите требуемую версию (3.0.0) => Установить
Method2: Использование Сценарии инициализации кластера
Сценарии инициализации кластера - это сценарии инициализации, определенные в конфигурации кластера. Сценарии инициализации кластера применяются как к создаваемым вами кластерам, так и к тем, которые созданы для выполнения заданий. Поскольку сценарии являются частью конфигурации кластера, управление доступом к кластеру позволяет вам контролировать, кто может изменять сценарии.
Шаг 1: Добавьте путь DBFS dbfs: /databricks/scripts/gdal_install.sh к сценариям инициализации кластера
# --- Run 1x to setup the init script. ---
# Restart cluster after running.
dbutils.fs.put("/databricks/scripts/gdal_install.sh","""
#!/bin/bash
sudo add-apt-repository ppa:ubuntugis/ppa
sudo apt-get update
sudo apt-get install -y cmake gdal-bin libgdal-dev python3-gdal""",
True)
Step2: Перезапустите кластер после первого запуска step1.
Для получения дополнительной информации см. " RasterFrames Notebook".
Надеюсь, это поможет. Дайте нам знать, если у вас есть какие-либо дополнительные вопросы.