Мне нужно создать фрейм данных, соединив два других фрейма данных. В новом фрейме данных я создаю новый столбец, вычисляя sum(Col1)
и деля его на число, которое я пробую ниже кодов, ни один из них не работает.
Как мы справляемся с делением столбца на константу в pyspark
Try 1:
df = df2.join(df1,cond,'inner).df1.groupby('category').withColumn('Amt',
(sum(df1('Col1'))/ 100))\
.withColumn('Amt1',(sum(df1(Col2))/ 100))\
.withColumn('Amt2',(sum(df1(Col3))/ 100))\
Try2:
(df1.agg(sum('Col1')))/lit(100)
Try3:
(df1.agg(sum('Col1')).div(100))
Отображаемая ошибка:
Попытка 3: AttributeError: у объекта «DataFrame» нет атрибута «div» Попытка 1 и 2: TypeError: неподдерживаемые типы операндов для /: 'DataFrame' и 'int'