Игнорировать подкаталог во внешней таблице в Apache Hive - PullRequest
0 голосов
/ 19 августа 2011

Есть ли в Hive параметр или способ заставить его игнорировать подкаталоги при запросе внешней таблицы? У меня есть подкаталог в папке таблицы, который не является частью данных таблицы, и я хочу избежать его удаления или копирования файлов в другом месте.

1 Ответ

1 голос
/ 20 августа 2011

Я решил свою проблему. В итоге я создал подкласс TextInputFormat и переопределил listStatus, что позволило мне отфильтровывать каталоги из списка файлов.

Для тех, кому интересно, зацените мое сообщение в списке рассылки Hive:

Re: игнорировать подкаталоги при запросе внешней таблицы

...