Ну, как вы уже написали, часть TLD эквивалентна, но длиннее (\.<tldpart>){1,2}
, но я уверен, что это может быть исправлено для дублирования ...
edit: yech, нет, это возможно, но, по-моему, очень медленный список грубой силы для обработки дубликатов. Проще и быстрее поместить возможные пары стран TLD и SLD + в большую хэш-карту и сравнить с ней подстроку.