Как я могу заставить Hive понимать пути моих существующих разделенных данных? - PullRequest
1 голос
/ 11 марта 2012

У меня есть данные на S3 в многораздельном формате, который должен хорошо работать с Hive, но пути не совсем соответствуют тому, что ожидает Hive. Есть ли способ, чтобы Hive знал о моих нестандартных путях к разделам?

Мои пути выглядят так:

s3://some-bucket/pageviews/20120311/ACME1234/example.com/data-file-1

Могу ли я как-то сказать Hive, что это следует интерпретировать как

s3://some-bucket/pageviews/dt=20120311/key=ACME1234/site=example.com/data-file-1

Существующие пути такие, какие они есть, их нельзя изменить, чтобы соответствовать ожиданиям Hive. Я также знаю, что я могу вручную добавить все разделы с помощью ALTER TABLE pageviews ADD PARTITION (...) LOCATION ..., но это быстро станет утомительным, даже если я его напишу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...