У меня был некоторый код Pyspark, который работал с образцом BLOB-файла csv, а затем я решил указать его на больший набор данных.Эта строка:
df= df.withColumn("TransactionDate", df["TransactionDate"].cast(TimestampType()))
Сейчас выдает эту ошибку:
AnalysisException: u'Cannot resolve column name "TransactionDate" among ("TransactionDate","Country ...
Очевидно, что TransactionDate существует в виде столбца в наборе данных, так почему он вдруг не работает?