У меня есть этот SQL-запрос, для hiveql в pyspark:
spark.sql('SELECT split(parse_url(page.viewed_page, "PATH"), "/")[1] as path FROM df')
И я хотел бы перевести в функциональный запрос, как:
df.select(split(parse_url(col('page.viewed_page'), 'HOST')))
, но когда я импортирую parse_url
function I get:
----> 1 from pyspark.sql.functions import split, parse_url
ImportError: cannot import name 'parse_url' from 'pyspark.sql.functions' (/usr/local/opt/apache-spark/libexec/python/pyspark/sql/functions.py)
Не могли бы вы указать мне правильное направление для импорта функции parse_url.
Приветствия