Question

Можно ли использовать Delta Lake и не зависеть от времени выполнения Databricks? (Я имею в виду, возможно ли использовать дельта-озеро с hdfs и spark только на прем?) Если нет, то не могли бы вы пояснить, почему это так с технической точки зрения?

jainnidhi · Answer 1 · 03 апреля 2020

Согласно документации: https://docs.delta.io/latest/quick-start.html#set -up- apache -искра-с-дельта-озером , озеро дельта было открыто для использования с Apache Spark. Интеграция может быть легко выполнена путем добавления к коду delta lake jar или добавления библиотеки в путь установки spark. Интеграция улья может быть выполнена с помощью: https://github.com/delta-io/connectors.

user3207359 · Answer 2 · 26 марта 2020

Согласно этому https://vimeo.com/338100834 можно использовать Delta Lake без Databricks Runtime. Delta Lake - это просто библиотека, которая «знает», как записывать и считывать транзакции в таблицу (набор файлов паркетных файлов), поддерживая специальный журнал транзакций помимо каждой таблицы. Конечно, для работы с такими столами необходим специальный разъем для внешних приложений (например, куст). В противном случае невозможно обеспечить соблюдение гарантий транзакций и согласованности.

Delta Lake без Databricks Runtime

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Delta Lake без Databricks Runtime

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы