сценарий, основанный на каждом формате файла в кусте - PullRequest
0 голосов
/ 08 апреля 2019

я новичок в Hadoop. Просто сейчас учусь посещать собеседования. Есть некоторые вопросы, которые были заданы в интервью, например, каков размер таблиц и каковы основные форматы файлов для него? сколько строк и т. д., которые не могут удовлетворить интервьюера. Пожалуйста, дайте мне знать любой сценарий, основанный на форматах файлов в Hadoop.

1 Ответ

0 голосов
/ 08 апреля 2019

Улей не скажет вам размер стола.Вам необходимо суммировать каталоги HDFS, состоящие из таблицы.

Формат таблицы можно найти, описав ее.Если вы знали Hive, вы должны понимать, какую команду использовать для этого.

Аналогично, в HiveQL есть оператор подсчета SQL для получения количества строк.Формат файла не имеет значения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...