У меня есть файл json, и я извлекаю список идентификаторов электронной почты - в частности, два списка (спам и легитимные электронные письма), но в этих списках я хотел бы исключить идентификаторы электронной почты в верхнем регистре, числовые и т. Д. Как можноЯ оставляю их вне списка?
with open(filename, 'r') as fp:
json_decode = json.loads(fp.read())
line = str(json_decode)
# find all emails
match = re.findall(r'[\w\.-]+@[\w.-]+', line)
legit = []
spam = []
for email in match:
email_status = email.endswith("gmail.com")
if email_status == False:
spam.append(email)
else:
ВЫХОД:
The legit list is {'taylor.l@gmail.com', '6ca63336ba8b483ca5f543cbad585fbb@gmail.com', 'Taylor.L@gmail.gov', 'abuse@gmail.com'} I want only one element - {'taylor.l@gmail.com'} and it's not always the first element in the list.
The spam list is {'n@TENT...', 'arealjcl@countable.us', 'image001.png@01D36CD8.2A2219D0', 'e8a1fdc83d13a56f4dbffdeb5942eba0@pisicano.cf'} and I want to remove everything except {'arealjcl@countable.us'}
Как я могу использовать регулярное выражение, чтобы выдвинуть условие, чтобы исключить ненужные мне электронные адреса?