Я использую этот запрос в базе данных MySQL
select *,
UNIX_TIMESTAMP(CONVERT_TZ(
SUBSTRING(input_date, 1, 19),
SUBSTRING(input_date, 20),
'SYSTEM'
)) as timestamp
from my_table
, которая используется для преобразования выборки input_date
отметки времени со смещением UTC (например, 2018-12-15T13:48:16-08:00
) в время эпохи.
Теперь мне нужно сделать то же самое, используя PySpark и получить доступ к этой таблице через соединение JDBC, но при попытке получить следующую ошибку
Py4JJavaError: An error occurred while calling o62.sql.
: org.apache.spark.sql.AnalysisException: Undefined function: 'CONVERT_TZ'. This function is neither a registered temporary function nor a permanent function registered in the database ...
Что я делаю неправильно?Есть ли лучший способ сделать это в PySpark?
Спасибо