Я работаю с HDP 2.6.4, а точнее Hive 1.2.1 с TEZ 0.7.0, Spark 2.2.0.
Моя задача проста.Сохраните данные в формате файла ORC, затем используйте Spark для обработки данных.Чтобы добиться этого, я делаю это:
- Создание таблицы Hive через HiveQL
- Использование Spark.SQL ("select ... from ...") для загрузки данных вдатафрейм
- обработка по фрейму данных
Мои вопросы: 1. Какова роль Улья за сценой?2. Можно ли пропустить Улей?