Spark позволяет использовать RegEx в качестве имени столбца в выражении SELECT
.По умолчанию это поведение отключено.Чтобы включить его, нам нужно установить для свойства ниже значение true
перед выполнением запроса со столбцами RegEx.
spark.sql("SET spark.sql.parser.quotedRegexColumnNames=true").show(false)
После установки этого свойства мы можем выбрать выражение с регулярным выражением, как показано ниже.
spark.sql("SELECT `(.*time.*)+.+` FROM test.orders limit 2""").show(false)
Примечание: здесь разрешено любое допустимое регулярное выражение Java.Я тестировал это решение в Spark 2.3