Я работаю на граничном узле Hadoop и запускаю сценарий оболочки bash, который вызывает два R-файла сценария по очереди.Эти сценарии R выполняют анализ текущих данных, а затем сохраняют файл CSV с именем формата «analysis_YYYYMMDD.csv» с сегодняшней датой в HDFS.
Мне нужно, чтобы этот CSV-файл был доступен в виде таблицы Hive.Я также добавляю эти данные в существующую таблицу.В настоящее время я беру ежедневный CSV и запускаю следующий код в Hive CLI:
create table schema.analysis_YYYYMMDD(col1 string, col2 string, col3 double)
row format delimited fields terminated by ',' stored as textfile ;
LOAD DATA INPATH 'analysis_YYYYMMDD.csv' OVERWRITE INTO TABLE
schema.analysis_YYYYMMDD;
INSERT INTO TABLE schema.all_analysis SELECT * FROM
schema.analysis_YYYYMMDD;
Я хотел бы включить этот код Hive CLI в свой скрипт оболочки, чтобы я мог удалить этот последний шаг вручную.Любые советы о том, как это сделать?