У меня есть пилотный кластер HBase с 1 ведущим и 5 подчиненными узлами.Я хочу получить доступ (в основном записывать данные показов рекламы через GET) к кластеру через его REST API.Я хочу иметь возможность позже запускать агрегированные отчеты, используя Hadoop / Hive? Pig (TBD), поэтому мне нужна одна картинка данных.
Запускаю ли я сервер REST на главном сервере и просто пишу на негоодна конечная точка, или я запускаю экземпляр REST-сервера на каждом подчиненном узле и записываю балансировку нагрузки на подчиненные узлы?
(Последнее кажется неправильным, но я видел некоторые упоминания об этом в документациинемного запутался).