Цикл улья для вставки данных - PullRequest
0 голосов
/ 25 апреля 2018

Можно ли сделать цикл в Hive, чтобы вставить в таблицу несколько случайных значений? Я понимаю, что могу создать скрипт на каком-то языке программирования, чтобы создать файл CSV с необходимым количеством строк, а затем загрузить CSV в куст в качестве внешней таблицы.

Итак, я хочу иметь таблицу с 1000000 строками. Схема:

  • name String,
  • s_name String,
  • age int

Заранее спасибо.

1 Ответ

0 голосов
/ 26 апреля 2018

Правильный способ - использовать CSV (или любой другой формат файла) для вставки данных в Hive. Если вы не хотите использовать язык программирования, вы можете использовать Excel (или любой другой анализ), чтобы генерировать строки со случайными данными по мере необходимости, а затем сохранять их в файле CSV. Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...