Потому что вы устанавливаете их как Pandas DataFrames, а не Spark DataFrames. Для объединений с Pandas DataFrames вы можете использовать
DataFrame_output = DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
Запустите это, чтобы понять, что это за DataFrame.
type(df)
Чтобы использовать withColumn
, вам понадобятся Spark DataFrames. Если вы хотите преобразовать DataFrames, используйте это:
import pyspark
from pyspark.sql import SparkSession
import pandas as pd
spark = SparkSession.builder.appName('pandasToSparkDF').getOrCreate()
df = spark.createDataFrame(pd_df1)