Я новичок в Python. Нужна помощь с блоками данных Azure.
Сценарий:
В настоящее время я работаю над проектом, который использует кластер HDInsight для отправки заданий спарк, и они используют скрипт Python с классами и функциями [.py], который находитсяв папке / bin / на граничном узле.
Мы предлагаем использовать блоки данных вместо кластера HDInsight, а PoC требует минимальных усилий.
Сомнения:
- В кластере HDInsight все сценарии python хранятся в папке / bin / и файлы conf с .yml в папке / conf /.
Можем ли мы повторить ту же структуру в DBFS блоков данных, чтобы минимальные измененияв коде для репликации местоположения.
2.Я новичок в Python, у меня есть несколько скриптов в папке / bin /. Как я могу загрузить или установить эти сценарии в блоках данных.
Я предполагаю, что мне нужно создать пакет и установить в кластер как библиотеку. Поправь меня, если я ошибаюсь.
Как запустить скрипты Python из Databricks.