Цель здесь - найти столбцы, которые не существуют в df, и создать их с нулевыми значениями.
У меня есть список имен столбцов, как показано ниже:
column_list = ('column_1', 'column_2', 'column_3')
Когда япопробуйте проверить, существует ли столбец, он выдает True только для тех столбцов, которые существуют и не получают значение False для тех, которые отсутствуют.
for column in column_list:
print df.columns.isin(column_list).any()
В PySpark я могу добиться этого с помощью приведенного ниже:
for column in column_list:
if not column in df.columns:
df = df.withColumn(column, lit(''))
Как мне достичь того же, используя Панд?