У нас есть транзакционные почасовые данные и данные ежедневной массовой загрузки из операционных систем, которые мы встраиваем в измерения (и факты) хранилища данных в среде MS SQL Server. Если рекомендуется, какие быстрые и эффективные методы (Flume, Sqoop, Kafka, HDFS, HBase, Hive, KUDU, Spark, Impla) мы могли бы применить для достижения этого в Hadoop? Предполагается, что эти измерения будут ежечасно использоваться хранилищем данных MS SQL Server.