Какая технология может позволить мне получить интерфейс в стиле Databricks для моего озера данных, но не локально? - PullRequest
0 голосов
/ 09 июля 2020

Я действительно доволен «доступностью» Databrick. Можно просто щелкнуть нужные базы данных, просмотреть таблицы и просмотреть их. Затем можно отображать и сохранять разные записные книжки (записные книжки в стиле Zeppelin), где можно запрашивать базы данных, используя разные языки (pyspark, python, sql, r, ..) или даже манипулировать данными с помощью сценариев Python и сохраните результаты, которые будут доступны в этом же интерфейсе.

Эти параметры и этот интуитивно понятный интерфейс действительно хороши для создания беспрепятственного опыта навигации по моему озеру данных (чтобы получить представление о базы данных и таблицы без необходимости запрашивать код, например) в облаке, но я хотел бы знать, какую аналогичную технологию я мог бы использовать локально?

Здесь прилагаются два скриншота Интерфейс Databrick. С левой стороны записные книжки в стиле Zeppelin доступны через значок «рабочая область», а базы данных доступны через «Данные»:

Notebook БД

Спасибо

1 Ответ

2 голосов
/ 10 июля 2020

Коммерческая версия: Cloudera Data Science Workbench

...