TypeError: объект DataFrame не вызывается - фрейм данных искры - PullRequest
0 голосов
/ 19 марта 2019

Я получаю ошибку ниже при выполнении упомянутого оператора соединения.Я использую настройку Pyspark.Любые изменения, требуемые в операторе или коде соединения.

TypeError: объект 'DataFrame' не может быть вызван

df11 = spark.read.option("header","true").option("delimiter", ",").csv("s3://mybucket/file1.csv")
df22 = spark.read.option("header","true").option("delimiter", ",").csv("s3://mybucket/file2.csv")
df11.createOrReplaceTempView("table1")
df22.createOrReplaceTempView("table2")
df1 = spark.sql( "select * from table1" )
df2 = spark.sql( "select * from table2" )

df_d = df1.join(df2, df1.NO == df2.NO, 'left').filter(F.isnull(df2.NO)).select(df1.NO,df1.NAME,df1.LAT,df1.LONG, F.lit('DELETE').alias('FLAG'))

Спасибо

1 Ответ

3 голосов
/ 19 марта 2019

используйте имена столбцов как строку, это должно работать

df_d = df1.join(df2, df1['NO'] == df2['NO'], 'left').filter(F.isnull(df2['NO'])).select(df1['NO'],df1['NAME'],df1['LAT'],df1['LONG'], F.lit('DELETE').alias('FLAG'))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...