У меня есть несколько столбцов с номерами кредитных карт вместе с другими номерами не кредитных карт, которые я читаю из файла .csv. Я хочу сначала отфильтровать номера кредитных карт с помощью регулярного выражения, а затем передать каждое из этих значений (номеров карт) в функцию, которая выполняет проверку Luhn, чтобы проверить, действительна ли кредитная карта или нет. Если функция возвращает true, тогда я добавляю значение индекса кредитной карты в список. Я использую значения индекса позже, используя .iloc, чтобы получить всю строку.
Это то, что я сделал до сих пор
data = pd.read_csv("fetched_data.csv")
summ = data['summary']
values =np.array(summ)
creditcards = []
regex_match_index_list =[]
Validcardsfound = 0
no_duplicate_list =[]
for i in range(len(values)):
temp = re.findall(r'(\b(?:\d[ -]*?){13,16}\b)',str(values[i]))
if temp:
for each in temp:
if doLuhn(str(each)) is True:
#print ("In the loop")
creditcards.append(each)
Validcardsfound = Validcardsfound + 1
regex_match_index_list.append(i)
elif doLuhn(str(temp)) is False:
pass
#print (str(temp))
else:
pass
Мой вопрос заключается в том, как удалить дубликаты карточек и затем добавить значения индекса.
Заранее спасибо!