Если вы планируете использовать hadoop для целей OLAP, то вы нашли правильный выбор.Теперь дни Озеро данных является более популярным, чем хранилище данных, среди предприятий, чтобы иметь данные в централизованном месте для целей анализа данных.
Чтобы ответить более конкретно на ваш вопрос для преобразования реляционных данных, вы можете использовать следующие инструменты,
- Hive : Наиболее популярные инструменты для хранилища данных Hadoop, аналогичные языку SQL для анализа.Хотя запросы имеют некоторую задержку при анализе данных, это связано с тем, что обработка данных выполняется на диске.
HBase : это произвольный доступ в реальном времени к данным в Hadoop, и он работает по принципуданных пары ключ-значение.И выполнение операции объединения невозможно с этим.
- SparkSQL : В наши дни SparkSQL более популярен для обработки данных, поскольку все данные обрабатываются в памяти кластера hadoop, и поэтому он быстрее по сравнению с задержкой кустов и запросов в секундах.
Существуют и другие инструменты для анализа полуструктурированных, неструктурированных и потоковых данных Hadoop.И этот вариант использования быстро в будущем.Таким образом, для более устойчивого решения Hadoop является лучшим решением.