Есть ли способ определить, где файл загружается в Azure Databricks, когда я выполняю веб-автоматизацию с использованием Selenium Python? - PullRequest
0 голосов
/ 29 апреля 2020

Я использую Selenium для веб-автоматизации и Python в качестве языка, и я делаю это в браузере Chrome.

У меня есть эта настройка в Azure Databricks. Я хочу скачать Excel с веб-сайта, и я делаю это, нажимая кнопку «Экспорт в Excel». Теперь, если я делаю то же самое в моей локальной системе, он загружается в папку «Загрузка» моего локального компьютера, но кто-нибудь может мне помочь найти, где он будет загружен сейчас, потому что он запускается через блокнот Azure Databricks.

Есть ли способ, с помощью которого я могу напрямую загрузить этот файл в хранилище BLOB-объектов или любое другое указанное c хранилище? Заранее спасибо.

Кнопка экспорта в Excel Export to Excel button

exportToExcel = driver.find_element_by_xpath('//*[@id="excelReport"]')
exportToExcel.click()
time.sleep(10)

1 Ответ

0 голосов
/ 04 мая 2020

Это параметры, доступные для загрузки файлов в Azure DBFS Файловой системы файлов данных.

Опция 1: Использование CLI блоков данных для загрузки файлов из локальных файлов. машина в DBFS.

Шаги по установке и настройке CLI

После установки базы данных cli вы можете использовать следующую команду для копирования файла в DBFS

dbfs cp test.txt dbfs:/test.txt
# Or recursively
dbfs cp -r test-dir dbfs:/test-dir

Вариант 2: DBFS Explorer для Databricks

DBFS Explorer был создан как быстрый способ загрузки и загрузки файлов в файловую систему Databricks (DBFS) , Это будет работать с экземплярами Databricks AWS и Azure. Вам необходимо создать токен на предъявителя в веб-интерфейсе для подключения.

Инструмент довольно базовый c, сегодня вы можете: [Загрузить, Загрузить, Создать Папки, Удалить файлы]

Перетаскивание файлов из Windows Explorer / Finder

Опция 3: Вы можете загружать данные в любую Azure учетную запись хранения, например [Azure Blob Storage, ADLS Gen1 / Gen2], и вы можете смонтировать контейнер хранения Blob или папку внутри контейнера в файловую систему Databricks (DBFS). Монтирование - это указатель на контейнер хранения BLOB-объектов, поэтому данные никогда не синхронизируются локально.

Ссылка: Блоки данных - Azure Хранение BLOB-объектов

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...