Несколько форматов коллекций для одной и той же таблицы в Hive - PullRequest
0 голосов
/ 08 марта 2012

Я обрабатываю данные с двумя картами для каждой записи, одна ("&", "=") - отформатирована (id = 111 & name = ...), другая - (";", "=") - отформатирована.

Конечно, я мог бы:

  • заменить ";""&" в данных
  • или определите
    • один из них как MAP с "ЭЛЕМЕНТАМИ КОЛЛЕКЦИИ, ПРЕКРАЩЕННЫМИ ...", указанными в объявлении
    • , и обработайте другую картукак STRING и анализируйте его с помощью str_to_map () при каждом запросе.

Но разве нет более элегантного решения, такого как объявление формата нескольких коллекций длятот же стол?

Спасибо.

1 Ответ

0 голосов
/ 21 июня 2012

Как насчет написания собственных Writable и SerDe для создания таблицы с 4 столбцами:

  • Строка key1
  • Строковое значение1
  • Строка key2
  • Строковое значение2

Вы можете использовать этот пример в качестве отправной точки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...