url ="https://www.siliconvalleypediatricdentistry.com/"
res=requests.get(url)
html=res.text
#re.findall(r'([\w0-9._-]+@[\w0-9._-]+\.[\w0-9_-]+)',html)
#re.findall(r"(^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$)",html)
Я нашел много вопросов по этому поводу, но большинство из них извлекают "неправильные" электронные письма
Я получаю это как вывод
['8b4e078a51d04e0e9efdf470027f0ec1@sentry.wixpress.com',
'core-js-bundle@3.2.1',
'whatwg-fetch@3.0.0',
'requirejs-bolt@2.3.6',
'svpdinfo@gmail.com',
'svpdinfo@gmail.com',
'SVPDinfo@gmail.com']
некоторые из них просто JS скриптов, есть ли безопасное регулярное выражение для использования или модуль, который делает это?