По сути, ваш duplicate_column_list
на самом деле не список, а строка столбцов, разделенных запятой.Вам необходимо составить этот список с помощью функции split
.drop_duplicates
обрабатывает все это как один столбец, поэтому вы не получите правильный результат.
Ниже приведены исходные данные: -
duplicate_column_list = 'active_proposal_no,active_proposal_revision_no,agency_id,adv_id,network_code,mkt_type,budget_seq_nbr,mkt_year_code'
Используйте функцию Split для создания списка: -
duplicate_column_list = 'active_proposal_no,active_proposal_revision_no,agency_id,adv_id,network_code,mkt_type,budget_seq_nbr,mkt_year_code'.split(",")
Split сделает его списком: -
duplicate_column_list = ['active_proposal_no','active_proposal_revision_no','agency_id','adv_id','network_code','mkt_type','budget_seq_nbr','mkt_year_code']
Теперь передайте этот списокотбросить дубликаты: -
df_input_file.drop_duplicates(duplicate_column_list)