Запрос Spark SQL for Create похож на this -
CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db_name.]table_name
[(col_name1 col_type1 [COMMENT col_comment1], ...)]
USING datasource
[OPTIONS (key1=val1, key2=val2, ...)]
[PARTITIONED BY (col_name1, col_name2, ...)]
[CLUSTERED BY (col_name3, col_name4, ...) INTO num_buckets BUCKETS]
[LOCATION path]
[COMMENT table_comment]
[TBLPROPERTIES (key1=val1, key2=val2, ...)]
[AS select_statement]
, где [x]
означает x
необязательно. Я хочу вывод в виде кортежа следующего порядка, если передан запрос CREATE
sql -
(db_name, table_name, [(col1 name, col1 type), (col2 name, col2 type), ...])
Так есть ли способ сделать это с помощью функций pyspark sql или вам нужна помощь от regex?
Если регулярное выражение может кто-нибудь помочь с регулярным выражением?