Как проверить список идентификаторов электронной почты и удалить те, которые являются бессмысленными / прописными с использованием Python - PullRequest
0 голосов
/ 20 марта 2019

У меня есть файл json, и я извлекаю список идентификаторов электронной почты - в частности, два списка (спам и легитимные электронные письма), но в этих списках я хотел бы исключить идентификаторы электронной почты в верхнем регистре, числовые и т. Д. Как можноЯ оставляю их вне списка?

with open(filename, 'r') as fp:
    json_decode = json.loads(fp.read())
    line = str(json_decode)

    # find all emails
    match = re.findall(r'[\w\.-]+@[\w.-]+', line)

    legit = []
    spam = []

    for email in match:
        email_status = email.endswith("gmail.com")
        if email_status == False:
            spam.append(email)
        else:

ВЫХОД:

     The legit list is {'taylor.l@gmail.com', '6ca63336ba8b483ca5f543cbad585fbb@gmail.com', 'Taylor.L@gmail.gov', 'abuse@gmail.com'} I want only one element - {'taylor.l@gmail.com'} and it's not always the first element in the list.

      The spam list is {'n@TENT...', 'arealjcl@countable.us', 'image001.png@01D36CD8.2A2219D0', 'e8a1fdc83d13a56f4dbffdeb5942eba0@pisicano.cf'} and I want to remove everything except {'arealjcl@countable.us'}

Как я могу использовать регулярное выражение, чтобы выдвинуть условие, чтобы исключить ненужные мне электронные адреса?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...