Получить данные из озера данных в аналитическую систему - PullRequest
0 голосов
/ 04 октября 2018

Мы создали новое озеро данных в файловой системе Hadoop.Данные хранятся в виде ORC.В настоящее время аналитическая система напрямую подключается к озеру данных для чтения этих файлов ORC.

Есть ли способ создать промежуточный слой между озером данных и аналитической системой для обслуживания данных?

Ответы [ 2 ]

0 голосов
/ 04 октября 2018

Вопрос очень общий, но один из распространенных и простых способов построения озера данных - это использовать Presto (https://prestodb.io).

Presto может читать несколько форматов, но также подключаться к различным источникам данных, таким как базы данных mysqlи другие, представляющие данные в виде таблицы.

Клиенты могут использовать SQL также через jdbc / odbc и, следовательно, получать доступ к озеру данных даже из таких инструментов, как excel, или других аналитических инструментов (микростратегия, таблицы и т. д.).

0 голосов
/ 04 октября 2018

Какое у вас аналитическое программное обеспечение?Можно ли использовать API или веб-сервисы RESTful для доступа к озеру данных?Пожалуйста, уточните немного больше.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...