Запросы Spark SQL по умолчанию используют SparkSQL.Я полагаю, что для включения синтаксиса HiveQL вы должны дать ему подсказку о своем намерении через комментарий.(Справедливости ради, я не думаю, что это хорошо документировано; мне удалось найти только косвенную ссылку на то, что это вещь здесь, и только в версии Scala примера.)
Например, я могу получить команду для анализа, написав:
%sql
-- `USING HIVE`
CREATE TABLE narf LIKE poit
Теперь у меня нет , включена поддержка Hive в моем сеансетак что мой запрос не выполняется ... но он анализирует!
Редактировать: Так как ваш оператор SQL находится в строке Python, вы можете использовать многострочныйстрока для использования синтаксиса однострочных комментариев, например:
sparkSession.sql("""
-- `USING HIVE`
CREATE EXTERNAL TABLE B LIKE A
""")
В SQL также есть синтаксис с разделителями комментариев, например,
sparkSession.sql("/* `USING HIVE` */ CREATE EXTERNAL TABLE B LIKE A")
, который также может работать.