для определенных строк - unix_timestamp возвращает нуль
raw_data.select(F.unix_timestamp(F.lit("2019-03-10T02:56:36Z"),format=date_format)).show(1)
+--------------------------------------------------------------+
|unix_timestamp(2019-03-10T02:56:36Z, yyyy-MM-dd'T'HH:mm:ss'Z')|
+--------------------------------------------------------------+
| null|
+--------------------------------------------------------------+
only showing top 1 row
, но почти для той же строки - я получаю ответ:
+---------------------------------------------------------------------------------------------+
|unix_timestamp(to_utc_timestamp(2019-03-10T02:56:36Z, America/New_York), yyyy-MM-dd HH:mm:ss)|
+---------------------------------------------------------------------------------------------+
| 1552204596|
+---------------------------------------------------------------------------------------------+
only showing top 1 row
при первом преобразовании проблемати c строка в UT C отметка времени - это работает ....
raw_data.select(F.unix_timestamp(F.to_utc_timestamp(F.lit("2019-03-10T02:56:36Z"), "America/New_York"))).show(1)
+---------------------------------------------------------------------------------------------+
|unix_timestamp(to_utc_timestamp(2019-03-10T02:56:36Z, America/New_York), yyyy-MM-dd HH:mm:ss)|
+---------------------------------------------------------------------------------------------+
| 1552204596|
+---------------------------------------------------------------------------------------------+
only showing top 1 row
это проблема при преобразовании строки с unix_timestamp? как я могу избежать преобразования в UT C?