Если вы загружаете данные в улей из задания mapreduce, вы можете настроить MR для выполнения преобразования данных за вас и загрузить их в таблицу так, как вам нужно (массив или; с разделителями и т. Д.). )
Если вы хотите обновить / скорректировать данные, вероятно, HIVE не лучший вариант для этого. Возможно, вы захотите взглянуть на HBase и выполнить «агрегацию», чтобы сгенерировать данные так, как вы хотите, чтобы они загружались в HBase. Каждый раз, когда генерируется одно и то же значение Key / ColumnFamily / Column, оно перезаписывает его, если оно существует, поэтому оно «обновляет» значение. Я использую это в производстве, чтобы генерировать данные в течение дня, которые постоянно обновляются.
В любом случае для манипулирования структурой больших объемов данных вы, вероятно, захотите использовать задание mapreduce и попросить его выполнить для вас реструктуризацию.