Мне нужно создать категорический столбец, в котором указано, был ли код учетной записи клиента введен в первый раз, т. Е. «Новый» или ранее, т. Е. «Существующий».
Необходимо учитывать только первое вхождениекак «Новый», остальные вхождения, независимо от разрыва в вхождениях, должны рассматриваться как «Существующие».
Я попытался просмотреть список уникальных кодов учетных записей, в которых я бы отфильтровал кадр данных.для этого конкретного кода счета и найдите минимальную дату, которая будет храниться в отдельной таблице.Затем, посмотрев на эту таблицу, я бы ввел тэг New / Existing в категориальный столбец.Не удалось выполнить его должным образом, хотя.Есть ли простой способ сделать это?
Я приложил образец файла ниже:
Образец данных
Также у данных есть некоторые не UTF-8 кодированных символов, которые я не смог обработать.