У меня есть тысячи URL-адресов, и я хочу извлечь доменные имена.Я использую следующее регулярное выражение, чтобы сделать это: http://|https://|www\\.
Это удается извлечь домены следующим образом:
elpais.com
veren.elpais.com
canaris7.es
vertele.eldiario.es
eldiario.es
Проблема в том, что я хочу извлечь только домен - этои vertele.eldiario.es, и eldiario.es должны дать мне eldiario.es.
Я также использовал urltools
, но, похоже, не справлялся с работой.Мне нужно извлечь домен, потому что мне нужно иметь правильное количество определенных доменов во всех URL.Меня интересует регулярное выражение, которое может извлекать TLD, оканчивающиеся на .com и .es.