Прежде всего, я не могу комментировать, так как у меня недостаточно репутации. Мне нужно больше разъяснений по этому вопросу. Не могли бы вы показать, как выглядят данные? Это немного сбивает с толку меня между 100, 101 и рейтингом 1-7 или 1-20.
Исходя из моего текущего понимания, я бы сначала удалил значение не по умолчанию из первого CSV. Поскольку вы используете Pandas, вы можете go через Lo c. Синтаксис, как правило, выглядит следующим образом.
df = df[df[cols] > 0]
Если они дублируются, оставьте последний месяц или текущий месяц в зависимости от вашего выбора. Pandas Поддержка удаления дубликата и возможность сохранения первой или последней записи. Синтаксис обычно выглядит следующим образом.
df = df.drop_duplicates(subset ="Col1", keep = 'last')
Для получения дополнительной документации, пожалуйста, обратитесь к: Pandas - Удалить дубликаты
Наконец, вам необходимо выполнить соединение для обоих фреймов данных на основе идентификатора кредита. Синтаксис обычно выглядит следующим образом.
df = pd.merge(df1, df2, how='left', on=['LoanID'])
Для получения дополнительной документации, пожалуйста, обратитесь к: Pandas - Объединить