Вы пытались использовать year(Issue_Date) >= 2018
?:
sparkdf4 = spark.sql("select * from table_view where year(to_date(cast(unix_timestamp(Issue_Date,'MM/dd/yyyy') as timestamp))) >= 2018")
Если в вашем столбце есть ошибки, и вы хотите указать диапазон, который вы можете использовать year IN (2018, 2019)
:
sparkdf4 = spark.sql("select * from table_view where year(to_date(cast(unix_timestamp(Issue_Date,'MM/dd/yyyy') as timestamp))) in (2018, 2019)")