Итак, у меня есть каталог hdfs, содержащий кучу файлов.Все эти файлы разделены табуляцией.
У меня есть оператор улья ....
create external table
mytable(
key string,
name string,
address string,
ssn string)
row format delimited fields
terminated by '09', lines terminted by '10'
STORED AS TEXTFILE location '/MyHiveFiles/data';
Это работает довольно хорошо, за исключением всех дополнительных полей.Файл также содержит от 0 до x дополнительных элементов данных после поля ssn.Они по-прежнему разделены табуляцией, а запись '\ n' разделена.Я мог бы добавить группу 'valuex string' (где x - приращение дополнительных элементов) ... но я не знаю, сколько их в конечном итоге может быть, и это в любом случае кажется грязным.
Есть лиспособ сказать hive просто поместить все оставшиеся поля этой строки в ОДНОЕ поле, как «строка других»?Даже если это разделитель табуляции в возвращаемом значении улья ... Я согласен с этим.
Спасибо, заранее.