Это мой настоящий код, он работает нормально
df_train_taxrate = (
df_train.groupby(
'Company_code_BUKRS',
'Vendor_Customer_Code_WT_ACCO',
'Expense_GL_HKONT',
'PAN_J_1IPANNO',
'HSN_SAC_HSN_SAC'
).agg(
f.collect_set('Section_WT_QSCOD').alias('Unique_Sectio_Code'),
f.collect_set('WHT_rate_QSATZ').alias('Unique_Wtax_rate')
)
)
Но проблема в том, что 'Section_WT_QSCOD, WHT_rate_QSATZ - это массивы, а при преобразовании массивов в строку я получаю ошибку ниже.
mycode:
df_train_taxrate = df_train.groupby(
'Company_code_BUKRS',
'Vendor_Customer_Code_WT_ACCO',
'Expense_GL_HKONT',
'PAN_J_1IPANNO',
'HSN_SAC_HSN_SAC'
).agg(
f.collect_set('Section_WT_QSCOD').withColumn(
'Section_WT_QSCOD',
concat_ws(',', 'Unique_Sectio_Code')
),
f.collect_set('WHT_rate_QSATZ').withColumn(
'WHT_rate_QSATZ',
concat_ws(',', 'Unique_W_tax_rate')
)
)
Ошибка:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'Column' object is not callable