Запросы разумного использования и хранения с R и Hadoop - PullRequest
0 голосов
/ 28 мая 2018

Я работаю над обнаружением аномалий с помощью временных рядов, использующих R. Данные хранятся в Hadoop.Существует последовательность запросов для выполнения во время выполнения скрипта, и они совершенно разные.

Я хотел знать, каков наилучший способ хранения этих запросов, чтобы их можно было легко поддерживать в случае изменений в структуре таблиц или пути доступа?Например, я видел, что с помощью Impala или Hive я могу сохранять запросы, но могу ли я тогда вызывать их из R с пакетом RJDBC?

Заранее спасибо.

...