Для требований учебного проекта я выбираю следующую технологию, поскольку источником данных является SQL СЕРВЕР
Исходный размер данных составляет 100 ГБ и 10 growth@quarter
Информация
Had oop - кластер с несколькими узлами (1Namenode + 3 DataNode) oop 3.1.2,
Apache Maven 3.6.0
Ubuntu 18.04
Ambari
Над настройкой теперь готов к следующему оставшемуся элементу
Sq oop: 1.4.7 Hive: 2.3.5 Ooz ie 5.0.0
Должны ли они быть установлены на отдельных компьютерах?
Какова стратегия развертывания после завершения разработки?