Хорошо, я думаю, что нашел причину. Это не связано с запросом. Это похоже на проблему при попытке создать таблицу с использованием файла CSV в Hive.
Когда вы выбираете источник - путь к файлу CSV в HDFS, а затем в формате - проверьте «Имеет заголовок» флажок.
Кажется, для создания таблицы все в порядке.
Затем, когда я выполняю следующее в Hive или Impala:
Select max(date) from xTable
Я получаю максимальную дату назад (где столбец даты является строкой)
Однако, когда я пытаюсь запустить его через Spark SQL:
, я получаю результат как date
(то же имя, что и заголовок столбца).
Если я удаляю заголовок из CSV-файла и импортирую его, а они вручную создают заголовки и типы, то я не сталкиваюсь с этой проблемой.
Похоже на некоторую форму ошибки или может быть ошибка пользователя с моего конца.