Я работаю над обнаружением аномалий с помощью временных рядов, использующих R. Данные хранятся в Hadoop.Существует последовательность запросов для выполнения во время выполнения скрипта, и они совершенно разные.
Я хотел знать, каков наилучший способ хранения этих запросов, чтобы их можно было легко поддерживать в случае изменений в структуре таблиц или пути доступа?Например, я видел, что с помощью Impala или Hive я могу сохранять запросы, но могу ли я тогда вызывать их из R с пакетом RJDBC?
Заранее спасибо.