Мне нужен доступ к данным с помощью Hive программно (данные в порядке ГБ на запрос).Я оценивал драйвер CLI и драйвер JDBC Hive.
Когда мы используем JDBC, возникает дополнительная нагрузка на экономный сервер, и я пытаюсь понять, насколько это тяжело.Также может ли это быть узким местом в одной точке, если несколько клиентов подключаются к одному комиссионному серверу?Или это обычная практика, когда люди настраивают несколько HQ-серверов на Hadoop и выполняют некоторые функции балансировки нагрузки?
Я ищу более высокую производительность, а не более быстрое создание прототипов.Заранее спасибо.