Я хочу построить структуру API / архитектуру поверх дистрибутива Cloudera Hadoop, чтобы дать вам контекст, у нас есть несколько таблиц в улье, мы хотим запросить эти таблицы и предоставить вывод конечному пользователю через RestAPI.
Насколько мне известно, инициирование запроса куста из RestAPI не будет хорошим дизайном, поскольку это приведет к большой задержке, поскольку обработка запроса в кусте занимает много времени из-за таких факторов, как механизм MapReduce, Yarn Jobотправка и т. д.
Вариант вышеупомянутого варианта использования заключается в том, чтобы предварительно вычислять запросы кустов через регулярные промежутки времени и сохранять выходные данные в HBase, а затем запрашивать таблицы HBase с помощью Phoenix через RestAPI и обслуживать выходные данные для конечного пользователя.
Пожалуйста, дайте мне знать, если вышеуказанный вариант выполним для моей постановки проблемы, или если у вас есть другой подход или предложение для решения этой проблемы, пожалуйста, поделитесь.