У меня есть список адресов электронной почты, некоторые из которых относятся к соответствующим доменам, а другие - из спамовых / нерелевантных доменов электронной почты. Я хочу захватить оба этих, но в отдельных списках. Я знаю, откуда берутся соответствующие (всегда один и тот же домен - @gmail.com
, но спам от разных, и все они должны быть перехвачены).
# Extract all email ids from a JSON file
import re
import json
with open("test.json", 'r') as fp:
json_decode = json.loads(fp.read())
line = str(json_decode)
match = re.findall(r'[\w\.-]+@[\w.-]+', line)
l = len(match)
print(match)
for i in match:
domain = match.split('@')[i]
OUTPUT: match = ['image001.png@01D36CD8.2A2219D0', 'arealjcl@countable.us', 'taylor.l.ingram@gmail.com']
Первые два являются спамом, а третий - законным адресом электронной почты, поэтому они должны быть в разных списках. Я делю на @
, чтобы определить домен, или исключаю все, что не @gmail.com
и помещаю в другой список.