Создать внешнюю таблицу кустов из hdfs csv с именами столбцов, извлеченными из первой строки csv - PullRequest
0 голосов
/ 04 февраля 2019

У меня есть папка с csv -файлами на hdfs.Первая строка каждого csv -файла одинакова (например: col1, col2, col3, ...) и состоит из имен столбцов внешней таблицы кустов, которые мне нужно создать из этих csv -файлов.Я могу пропустить первую строку и создать внешнюю таблицу с перечислением имен полей в запросе следующим образом:

CREATE EXTERNAL TABLE my_table(
  col1 string,
  col2 string,
  col3 string,
  .
  .
  .
  .
  )
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LOCATION 'data/table/'
tblproperties ("skip.header.line.count"="1");

Я хотел бы знать, есть ли способ создать внешнюю таблицу без необходимостипропустите первую строку и введите имена полей самостоятельно, т.е. я бы хотел, чтобы мой запрос независимо извлекал имя поля из строки заголовка csv -файлов и создавал таблицу.

...